Мониторинг Яндекс Облака с помощью Proto Observability Platform

Сбор метрик облачной платформы Яндекс Облако

На этой странице:

Сбор метрик Yandex Cloud

Интеграция yandex_cloud собирает метрики через Yandex Cloud Monitoring API в формате Prometheus text. На каждой паре folder_id × yandex_cloud_service агент выполняет HTTP GET к https://monitoring.api.cloud.yandex.net/monitoring/v2/prometheusMetrics и парсит ответ построчно.

В системе доступен сбор любых метрик из Яндекс Облака; для метрик Compute Cloud поставляются встроенные дашборды, позволяющие анализировать производительность виртуальных машин:

  • Список виртуальных машин Compute Cloud: yandex-cloud-list
  • Дашборд виртуальной машины Compute Cloud: yandex-cloud-vm

Ссылки на официальную документацию:

Конфигурация ProtoOBP агента

Если агент запускается в виде службы на хосте

  1. Положите файл проверки yandex_cloud.py в /etc/protoobp-agent/checks.d/.

  2. Создайте файл /etc/protoobp-agent/conf.d/yandex_cloud.d/conf.yaml:

    init_config:
    
    instances:
      - folder_id:
          - "<FOLDER_ID_1>"
          - "<FOLDER_ID_2>"
        yandex_cloud_service:
          - "compute"
          - "managed-clickhouse"
          - "managed-kubernetes"
        api_key: "<YANDEX_API_KEY>"
        metrics:
        label_tag_allowlist: []
        tags:
          - platform:yandex_cloud
        metric_prefix: "yandex_cloud."
        timeout: 10
        ssl_verify: true
    
  3. Перезапустите агента: systemctl restart protoobp-agent.

Если агент запускается в виде Docker контейнера

Смонтируйте каталоги checks.d и conf.d/yandex_cloud.d в контейнер агента и передайте folder_id, yandex_cloud_service и api_key через переменные окружения. В docker-compose.yaml:

services:
  protoobp-agent:
    image: registry.git.proto.group/protoobp/protoobp-artifacts/protoobp-agent:7.40.3
    volumes:
      - ./checks.d:/etc/protoobp-agent/checks.d:ro
      - ./conf.d/yandex_cloud.d:/etc/protoobp-agent/conf.d/yandex_cloud.d:ro
    environment:
      - POBP_API_KEY=${POBP_API_KEY}
      - POBP_POBP_URL=${POBP_BACKEND_URL}
      - YANDEX_API_KEY=${YANDEX_API_KEY}
      - YANDEX_FOLDER_ID=${YANDEX_FOLDER_ID}
      - YANDEX_SERVICE=${YANDEX_SERVICE}

Файл conf.d/yandex_cloud.d/conf.yaml рядом — тот же, что и для службы на хосте; folder_id, yandex_cloud_service и api_key агент возьмёт из переменных окружения, поэтому в YAML их можно оставить пустыми или вовсе убрать соответствующие ключи.

Переменные окружения

ПеременнаяНазначение
YANDEX_API_KEYAPI-ключ Yandex Cloud. Передаётся в заголовке Authorization: Bearer <key>.
YANDEX_FOLDER_IDID папки. Можно несколько значений через запятую или пробел.
YANDEX_SERVICEИмя сервиса Yandex Cloud. Можно несколько значений через запятую или пробел.

Если значение указано и в YAML, и в переменной окружения, приоритет — у YAML.

Параметры конфигурации

ПараметрНазначение
api_keyAPI-ключ Yandex Cloud (см. также YANDEX_API_KEY).
folder_idСписок ID папок, метрики которых нужно собрать (см. также YANDEX_FOLDER_ID).
yandex_cloud_serviceСписок сервисов Yandex Cloud (см. также YANDEX_SERVICE).
metricsСписок имён метрик для отбора. Пусто — собираются все метрики, которые вернул API.
label_tag_allowlistСписок лейблов, которые превращаются в теги. Пусто ([]) — превращаются все лейблы.
tagsСтатические теги, добавляемые ко всем метрикам.
metric_prefixПрефикс, добавляемый ко всем именам метрик.
timeoutТаймаут HTTP-запроса в секундах.
ssl_verifyПроверка TLS-сертификата API.

Как происходит сбор метрик

  • Для каждой пары folder_id × yandex_cloud_service выполняется GET-запрос: <endpoint>?folderId=<folder_id>&service=<service>.
  • Ответ читается как Prometheus text format и парсится построчно.
  • Все значения отправляются как gauge. Типы метрик из документации Yandex Cloud Monitoring (RATE, HIST_RATE, DGAUGE, IGAUGE) на стороне интеграции не сохраняются: в Proto Observability Platform все они попадают как gauge, поэтому гистограммы и rate автоматически не обрабатываются.
  • Метрики типа RATE (например, байты/с, операции/с) на дашбордах рекомендуется отображать как «текущее значение».
  • Некорректные и нечисловые значения игнорируются.
  • При временной ошибке (HTTP 429, 5xx, таймаут) выполняется один повторный запрос с увеличенным таймаутом.

Теги, добавляемые автоматически

К каждой точке добавляются:

  • folder_id:<id> — ID папки.
  • yandex_cloud_service:<service> — сервис, для которого собирались метрики.
  • Все лейблы Prometheus-метрики (с учётом label_tag_allowlist). Лейбл service автоматически переименовывается в yandex_cloud_service, чтобы не затирать общий тег service агента.

Особый случай для дисков:

  • Если метрика содержит лейбл disk, но не содержит instance, интеграция ищет instance в других метриках с тем же disk и подставляет его.
  • Дисковым метрикам дополнительно проставляется resource_id, равный instance (или найденному по disk).

Проверка

Убедитесь, что проверка запустилась и собирает метрики:

docker exec protoobp-agent agent status | grep -A 10 "yandex_cloud (unversioned)"

Ожидаемый вывод — Instance ID: ... [OK] и ненулевое Metric Samples:

    yandex_cloud (unversioned)
    --------------------------
      Instance ID: yandex_cloud:e8aa6920911941c3 [OK]
      Configuration Source: file:/etc/protoobp-agent/conf.d/yandex_cloud.d/conf.yaml
      Total Runs: 90
      Metric Samples: Last Run: 1,618, Total: 143,289
      Events: Last Run: 0, Total: 0
      Service Checks: Last Run: 1, Total: 90
      Average Execution Time : 3.649s
      Last Execution Date : 2026-05-13 13:47:16 UTC
      Last Successful Execution Date : 2026-05-13 13:47:16 UTC

Запустить проверку вручную:

docker exec protoobp-agent agent check yandex_cloud

Список метрик

  • yandex_cloud_services — служебная метрика (gauge = 1) на каждую комбинацию folder_id × service.
  • Все метрики, которые вернул Yandex Cloud Monitoring Prometheus Metrics API для указанных сервисов.
    • Итоговое имя метрики формируется как yandex_cloud_ + исходное имя, при этом точки заменяются на _. Пример: filestore.read_opsyandex_cloud_filestore_read_ops.
    • Чтобы ограничить набор, используйте параметр metrics со списком исходных имён из Yandex Cloud Monitoring.

Метрики Compute Cloud

Все метрики Compute Cloud имеют тег yandex_cloud_service=compute. Если у ресурса задано имя, в метках возвращается имя; иначе — идентификатор. В таблицах ниже приведены итоговые имена метрик в Proto Observability Platform (префикс yandex_cloud_, точки заменены на _).

Виртуальные машины и диски
МетрикаОписаниеМетки
yandex_cloud_cpu_usageУтилизация CPU ВМ (может быть > 100 % при использовании сверх гарантии).resource_id, resource_type=vm
yandex_cloud_cpu_utilizationУтилизация vCPU от 0 % до уровня производительности.cpu_name, resource_id, resource_type=vm
yandex_cloud_disk_io_quota_utilization_percentageСредний процент использования квоты диска.disk
yandex_cloud_disk_io_quota_utilization_percentage_burstМаксимальный процент использования квоты диска.disk
yandex_cloud_disk_read_bytesСреднее количество байт, прочитанных с диска ВМ.disk, instance
yandex_cloud_disk_read_bytes_burstМаксимальное количество байт, прочитанных с диска ВМ.disk, instance
yandex_cloud_disk_read_bytes_in_flightСреднее количество байт, читаемых в данный момент.disk, instance
yandex_cloud_disk_read_bytes_in_flight_burstМаксимальное количество байт, читаемых в данный момент.disk, instance
yandex_cloud_disk_read_errorsОшибки чтения с диска ВМ.disk, instance
yandex_cloud_disk_read_latencyГистограмма времени обработки чтения.disk, instance
yandex_cloud_disk_read_opsСреднее количество операций чтения.disk, instance
yandex_cloud_disk_read_ops_burstМаксимальное количество операций чтения.disk, instance
yandex_cloud_disk_read_ops_in_flightСреднее число операций чтения в данный момент.disk, instance
yandex_cloud_disk_read_ops_in_flight_burstМаксимальное число операций чтения в данный момент.disk, instance
yandex_cloud_disk_read_throttler_delayГистограмма задержек чтения при превышении квоты.disk
yandex_cloud_disk_write_bytesСреднее количество байт, записанных на диск ВМ.disk, instance
yandex_cloud_disk_write_bytes_burstМаксимальное количество байт, записанных на диск ВМ.disk, instance
yandex_cloud_disk_write_bytes_in_flightСреднее количество байт, записываемых в данный момент.disk, instance
yandex_cloud_disk_write_bytes_in_flight_burstМаксимальное количество байт, записываемых в данный момент.disk, instance
yandex_cloud_disk_write_errorsОшибки записи на диск ВМ.disk, instance
yandex_cloud_disk_write_latencyГистограмма времени обработки записи.disk, instance
yandex_cloud_disk_write_opsСреднее количество операций записи.disk, instance
yandex_cloud_disk_write_ops_burstМаксимальное количество операций записи.disk, instance
yandex_cloud_disk_write_ops_in_flightСреднее число операций записи в данный момент.disk, instance
yandex_cloud_disk_write_ops_in_flight_burstМаксимальное число операций записи в данный момент.disk, instance
yandex_cloud_disk_write_throttler_delayГистограмма задержек записи при превышении квоты.disk
yandex_cloud_maintenance_event1, если активно событие обслуживания (migrate / restart).resource_id, resource_type=vm, type
yandex_cloud_network_connections_quota_utilizationУтилизация квоты на количество соединений ВМ.resource_id, resource_type=vm
yandex_cloud_network_connections_interface_quota_utilizationУтилизация квоты соединений по интерфейсу ВМ.resource_id, resource_type=vm, interface_number
yandex_cloud_network_received_bytesВходящий трафик по интерфейсу.interface_number, resource_id, resource_type=vm
yandex_cloud_network_received_packetsВходящие пакеты по интерфейсу.interface_number, resource_id, resource_type=vm
yandex_cloud_network_sent_bytesИсходящий трафик по интерфейсу.interface_number, resource_id, resource_type=vm
yandex_cloud_network_sent_packetsИсходящие пакеты по интерфейсу.interface_number, resource_id, resource_type=vm
Файловые хранилища

Общие лейблы для метрик файловых хранилищ:

  • filestore — идентификатор файлового хранилища.
  • instance — имя виртуальной машины.
МетрикаОписаниеМетки
yandex_cloud_filestore_index_cumulative_timeСовокупное время операций индексации.request
yandex_cloud_filestore_index_errorsОшибки операций индексации.request
yandex_cloud_filestore_index_latencyЗадержка индексации (гистограмма).request, bin
yandex_cloud_filestore_index_opsСреднее число операций индексации.request
yandex_cloud_filestore_read_bytesСреднее число байт, прочитанных из хранилища.
yandex_cloud_filestore_read_bytes_burstМаксимум байт, прочитанных из хранилища.
yandex_cloud_filestore_read_errorsОшибки чтения.request
yandex_cloud_filestore_read_latencyГистограмма времени чтения.bin
yandex_cloud_filestore_read_opsСреднее число операций чтения.
yandex_cloud_filestore_read_ops_burstМаксимум операций чтения.
yandex_cloud_filestore_write_bytesСреднее число байт, записанных в хранилище.
yandex_cloud_filestore_write_bytes_burstМаксимум байт, записанных в хранилище.
yandex_cloud_filestore_write_errorsОшибки записи.request
yandex_cloud_filestore_write_latencyГистограмма времени записи.bin
yandex_cloud_filestore_write_opsСреднее число операций записи.
yandex_cloud_filestore_write_ops_burstМаксимум операций записи.
Группы виртуальных машин

Доступные метрики зависят от типа масштабирования группы ВМ.

МетрикаОписаниеМеткиТип масштабирования
yandex_cloud_average_utilizationСреднее потребление ресурсов по группе.resource_id, resource_type=instance_group, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_average_utilization_in_zoneСреднее потребление ресурсов в зоне.resource_id, resource_type=instance_group, zone_id, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_instances_countКоличество ВМ в группе.resource_id, resource_type=instance_groupавтоматический; фиксированный с тестом автоматического; фиксированный
yandex_cloud_instances_count_in_zoneКоличество ВМ в зоне.resource_id, resource_type=instance_group, zone_idавтоматический; фиксированный с тестом автоматического; фиксированный
yandex_cloud_measured_percent_in_zoneУтилизация CPU ВМ в зоне (может быть > 100 %).resource_id, resource_type=instance_group, zone_id, source_metricфиксированный с тестом автоматического
yandex_cloud_summary_capacityСуммарное потребление, при котором масштабирование увеличит группу.resource_id, resource_type=instance_group, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_summary_capacity_in_zoneСуммарное потребление в зоне, при котором масштабирование увеличит группу.resource_id, resource_type=instance_group, zone_id, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_summary_utilizationСуммарное потребление ресурсов по группе.resource_id, resource_type=instance_group, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_target_instances_countЦелевое количество ВМ в группе.resource_id, resource_type=instance_groupавтоматический; фиксированный с тестом автоматического; фиксированный
yandex_cloud_target_instances_count_in_zoneЦелевое количество ВМ в зоне.resource_id, resource_type=instance_group, zone_idавтоматический; фиксированный с тестом автоматического; фиксированный
yandex_cloud_test_autoscale_target_instances_countЦелевое число ВМ по политике теста автомасштабирования.resource_id, resource_type=instance_groupфиксированный с тестом автоматического
yandex_cloud_test_autoscale_target_instances_count_in_zoneЦелевое число ВМ в зоне по политике теста автомасштабирования.resource_id, resource_type=instance_group, zone_idфиксированный с тестом автоматического
yandex_cloud_target_utilizationЦелевое потребление ресурсов для одной ВМ.resource_id, resource_type=instance_group, source_metricавтоматический; фиксированный с тестом автоматического
yandex_cloud_utilization_in_zoneСуммарное потребление ресурсов в зоне.resource_id, resource_type=instance_group, zone_id, source_metricавтоматический; фиксированный с тестом автоматического

Метрики Managed Kubernetes

Все метрики Managed Kubernetes имеют тег yandex_cloud_service=managed-kubernetes.

Мастер
МетрикаОписаниеМетки
yandex_cloud_master_cpu_utilization_percentУтилизация процессора.cluster_id, exported_host, folder_id, host, platform, yandex_cloud_service
yandex_cloud_master_memory_utilization_percentУтилизация памяти.cluster_id, exported_host, folder_id, host, platform, yandex_cloud_service
Контейнеры
МетрикаОписаниеМетки
yandex_cloud_container_cpu_core_usage_timeСовокупная загрузка процессора на всех ядрах, используемых контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_cpu_limit_coresОграничение количества ядер процессора в контейнере.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_cpu_limit_utilizationУтилизация количества ядер процессора.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_cpu_request_coresКоличество ядер процессора, запрошенных контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_cpu_request_utilizationУтилизация количества ядер процессора, запрошенных контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_ephemeral_storage_used_bytesИспользование эфемерного хранилища.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_limit_bytesОграничение объёма памяти контейнера.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_limit_utilizationУтилизация памяти контейнера.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_page_fault_countОшибки страниц памяти в разбивке по типам major/minor.cluster_id, container, fault_type, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_request_bytesОбъём памяти, запрошенной контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_request_utilizationУтилизация памяти, запрошенной контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_used_bytesИспользование памяти контейнером.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_memory_working_set_bytesИспользуемая память рабочего набора контейнера.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_restart_countКоличество перезапусков контейнера.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_container_uptime_secondsВремя работы контейнера с момента запуска.cluster_id, container, folder_id, host, namespace, platform, pod, yandex_cloud_service
Узлы
МетрикаОписаниеМетки
yandex_cloud_node_cpu_allocatable_coresКоличество доступных ресурсов процессора на узле.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_cpu_core_usage_timeСовокупная загрузка процессора на всех ядрах, используемых узлом.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_cpu_total_coresОбщее количество процессорных ядер узла.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_ephemeral_storage_allocatable_bytesКоличество доступных ресурсов эфемерного хранилища на узле.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_ephemeral_storage_inodes_freeЧисло свободных индексных дескрипторов.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_ephemeral_storage_inodes_totalОбщее число индексных дескрипторов.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_ephemeral_storage_total_bytesРазмер эфемерного хранилища.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_ephemeral_storage_used_bytesИспользование эфемерного хранилища узлом.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_memory_allocatable_bytesКоличество доступных ресурсов оперативной памяти на узле.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_memory_total_bytesОбщий объём памяти узла.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_memory_used_bytesИспользование памяти узлом.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_memory_working_set_bytesИспользуемая память рабочего набора узла.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_network_received_bytes_countВходящий трафик (получено байтов из сети).cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_network_sent_bytes_countИсходящий трафик (передано байтов в сеть).cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_pid_limitОграничение количества идентификаторов процессов в узле.cluster_id, folder_id, host, node, platform, yandex_cloud_service
yandex_cloud_node_pid_usedИспользование идентификаторов процессов в узле.cluster_id, folder_id, host, node, platform, yandex_cloud_service
Поды
МетрикаОписаниеМетки
yandex_cloud_pod_cpu_core_usage_timeСовокупная загрузка процессора на всех ядрах, используемых подом.cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_ephemeral_storage_used_bytesИспользование эфемерного хранилища подом.cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_memory_used_bytesИспользование памяти подом.cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_memory_working_set_bytesИспользуемая память рабочего набора пода.cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_network_received_bytes_countВходящий трафик (получено байтов из сети).cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_network_sent_bytes_countИсходящий трафик (передано байтов в сеть).cluster_id, folder_id, host, namespace, platform, pod, yandex_cloud_service
yandex_cloud_pod_volume_total_bytesОбщий объём временного тома.cluster_id, folder_id, host, namespace, platform, pod, volume, yandex_cloud_service
yandex_cloud_pod_volume_used_bytesИспользование временного тома.cluster_id, folder_id, host, namespace, platform, pod, volume, yandex_cloud_service
yandex_cloud_pod_volume_utilizationУтилизация временного тома.cluster_id, folder_id, host, namespace, platform, pod, volume, yandex_cloud_service
Постоянные тома
МетрикаОписаниеМетки
yandex_cloud_persistent_volume_inodes_freeЧисло свободных индексных дескрипторов.cluster_id, folder_id, host, namespace, persistentvolumeclaim, platform, yandex_cloud_service
yandex_cloud_persistent_volume_inodes_totalОбщее число индексных дескрипторов.cluster_id, folder_id, host, namespace, persistentvolumeclaim, platform, yandex_cloud_service
yandex_cloud_persistent_volume_total_bytesОбщий объём постоянного тома.cluster_id, folder_id, host, namespace, persistentvolumeclaim, platform, yandex_cloud_service
yandex_cloud_persistent_volume_used_bytesИспользование постоянного тома.cluster_id, folder_id, host, namespace, persistentvolumeclaim, platform, yandex_cloud_service
yandex_cloud_persistent_volume_utilizationУтилизация постоянного тома.cluster_id, folder_id, host, namespace, persistentvolumeclaim, platform, yandex_cloud_service

Служебная метрика интеграции

МетрикаОписаниеМетки
yandex_cloud_servicesТехнический gauge со значением 1 на каждую успешную пару folder_id × yandex_cloud_service.folder_id, yandex_cloud_service (+ статические из tags)