Просмотр алертов и событий
На этой странице:
Раздел Алерты главного меню содержит, помимо настройки, три представления для просмотра сработавших алертов и связанных событий: Активные, История и События. Здесь описано, что показывает каждое из них. О настройке правил, каналов и политик см. Настройка оповещений.
Активные алерты
Алерты > Активные — стена алертов в реальном времени: все алерты, находящиеся сейчас в статусе firing. Карточки сгруппированы по критичности (CRITICAL, WARNING) и по правилу/категории; счётчик вверху показывает общее число активных алертов. Представление обновляется автоматически.
На каждой карточке отображаются сервис, описание алерта, длительность и (при наличии аннотации) ссылка на дашборд. Это основное представление для дежурного — чтобы быстро увидеть, что горит прямо сейчас.
Здесь же алерты можно подтверждать (acknowledge) и ставить на тишину (silence) — временно заглушать уведомления для подходящих по лейблам алертов на заданный срок. Это удобно, когда команда уже занимается проблемой и не нужно получать повторные уведомления.
Скриншот: стена активных алертов, сгруппированных по критичности.
История алертов
Алерты > История — журнал сработавших алертов за выбранный период. Период задаётся в верхней панели; результаты можно выгрузить (Экспорт) и отфильтровать.
График «Активные алерты» показывает динамику числа алертов (CRITICAL / WARNING) во времени, а таблица «История» перечисляет отдельные срабатывания со столбцами:
| Столбец | Значение |
|---|---|
| Сост. | состояние алерта (активен / разрешён) |
| Критичность | CRITICAL или WARNING |
| Описание | текст из описания правила |
| Где | сервис или объект, к которому относится алерт |
| Начало / Конец | время начала и завершения срабатывания |
| Длит-ть (мин) | продолжительность срабатывания |
| Контекст | переход к связанному дашборду/объекту |
Вкладки Обзор, Анализ и MTTR дают сводную аналитику по алертам, включая среднее время устранения (MTTR).
Скриншот: график динамики и таблица истории алертов.
События
Алерты > События — лента событий инфраструктуры и приложений за выбранный период: события Kubernetes (например, Unhealthy, FailedMount), маркеры релизов из CI/CD и другие. Диаграммы «События по типу» и «События по источнику» показывают распределение, а таблица перечисляет события со столбцами: Сообщение, Время, Тип, Хост, Источник, Контекст.
События полезны для сопоставления алертов с изменениями — например, чтобы увидеть, что всплеск ошибок совпал с релизом. О передаче маркеров релизов из пайплайна см. Интеграция с CI/CD.
Скриншот: события по типу и источнику с таблицей.