Просмотр алертов и событий

Как смотреть сработавшие алерты в Proto Observability Platform: реальное время (Активные), история алертов с аналитикой и MTTR, лента событий.

На этой странице:

Раздел Алерты главного меню содержит, помимо настройки, три представления для просмотра сработавших алертов и связанных событий: Активные, История и События. Здесь описано, что показывает каждое из них. О настройке правил, каналов и политик см. Настройка оповещений.

Активные алерты

Алерты > Активные — стена алертов в реальном времени: все алерты, находящиеся сейчас в статусе firing. Карточки сгруппированы по критичности (CRITICAL, WARNING) и по правилу/категории; счётчик вверху показывает общее число активных алертов. Представление обновляется автоматически.

На каждой карточке отображаются сервис, описание алерта, длительность и (при наличии аннотации) ссылка на дашборд. Это основное представление для дежурного — чтобы быстро увидеть, что горит прямо сейчас.

Здесь же алерты можно подтверждать (acknowledge) и ставить на тишину (silence) — временно заглушать уведомления для подходящих по лейблам алертов на заданный срок. Это удобно, когда команда уже занимается проблемой и не нужно получать повторные уведомления.

Активные алерты в реальном времени Скриншот: стена активных алертов, сгруппированных по критичности.

История алертов

Алерты > История — журнал сработавших алертов за выбранный период. Период задаётся в верхней панели; результаты можно выгрузить (Экспорт) и отфильтровать.

График «Активные алерты» показывает динамику числа алертов (CRITICAL / WARNING) во времени, а таблица «История» перечисляет отдельные срабатывания со столбцами:

СтолбецЗначение
Сост.состояние алерта (активен / разрешён)
КритичностьCRITICAL или WARNING
Описаниетекст из описания правила
Гдесервис или объект, к которому относится алерт
Начало / Конецвремя начала и завершения срабатывания
Длит-ть (мин)продолжительность срабатывания
Контекстпереход к связанному дашборду/объекту

Вкладки Обзор, Анализ и MTTR дают сводную аналитику по алертам, включая среднее время устранения (MTTR).

История алертов и аналитика Скриншот: график динамики и таблица истории алертов.

События

Алерты > События — лента событий инфраструктуры и приложений за выбранный период: события Kubernetes (например, Unhealthy, FailedMount), маркеры релизов из CI/CD и другие. Диаграммы «События по типу» и «События по источнику» показывают распределение, а таблица перечисляет события со столбцами: Сообщение, Время, Тип, Хост, Источник, Контекст.

События полезны для сопоставления алертов с изменениями — например, чтобы увидеть, что всплеск ошибок совпал с релизом. О передаче маркеров релизов из пайплайна см. Интеграция с CI/CD.

Лента событий Скриншот: события по типу и источнику с таблицей.