Релиз 195 Proto Observability Platform

Основной темой новой версии Proto Observability стало расширение возможностей мониторинга бизнес-операций и ускорения расследования инцидентов.

Дата выпуска: 20.06.2025

Новые возможности 🎉

Мониторинг бизнес-операций

Теперь в модуле APM доступен раздел Транзакции. Платформа автоматически определяет ключевые бизнес-операции (оплата, добавление товара в корзину, вход/выход и многие другие) и анализирует их исполнение.

../images/195-apm-key-business-transaction.png

Также возможно обозначить любую необходимую операцию как ключевую в удобном конструкторе в UI Proto Observability. Конструктор доступен в модуле APM в разделе Настройки APM.

На дашборде Ключевой бизнес-транзакции представлена вся необходимая информация для детального анализа выполнения бизнес-операции.

../images/195-kbt-dashboard-main.png

  • На вкладке Обзор доступны следующие данные:

    • Название транзакции
    • Операция (имя эндпоинта)
    • Сервис транзакции - с возможностью перехода по ссылке к дашборду этого сервиса
    • Длительность исполнения транзакции
  • Схема бизнес-транзакции – автоматически генерируется, показывает все сервисы и инфраструктурные компоненты, участвующие в выполнении операции.

    Цветовой индикацией на схеме выделяются проблемные компоненты.

    Для каждой связи выводятся необходимые для анализа показатели:

    • Количество вызовов в минуту
    • Процент ошибок
    • Время отклика
    • Тип вызова

    Виджет Схема доступен в 3 вариантах отображения и с возможностью широкоэкранного просмотра.

  • Скоринг транзакции – платформа автоматически группирует вызовы бизнес-операции в 4 группы и по каждой показывает количество и процентное соотношение:

    • Error - вызовы операции с ошибками
    • Normal - вызовы без ошибок и с нормальным временем исполнения
    • Slow - вызовы, исполняющиеся в три раза больше стандартного отклонения за последние 2 часа (> 3 sigma < 4 sigma).
    • Very Slow - вызовы, исполняющиеся в 4 раза больше стандартного отклонения за последние 2 часа (> 4 sigma)
  • Проблемы, актуальные сейчас.

  • Виджеты Вызовы, Длительность и Ошибки – показывают как числовые значения по данным метрикам, так и визуализацию в виде графиков.

  • Вкладка Ошибки.

    В этом разделе представлен анализ групп ошибок конкретной бизнес-операции, с возможностью перейти к группе и посмотреть операции, сообщения, стэк стрейс, время первого и последнего появления ошибки и другие ценные данные.

  • Вкладка AIOPS.

    Здесь представлены топ проблем бизнес-операции, MTTR анализ, графики с визуализацией распредления аномалий и трендов во времени, анализ алертов по критичности и их история.

  • Вкладка Трейсы.

    В данном разделе выводятся все трейсы бизнес-операции и их детальная аналитика.

  • Вкладка Связи.

    Представлен анализ связей и вызовов в рамках бизнес-операции.

Алертинг по Ключевым бизнес-транзакциям

Для бизнес-транзакций автоматически высчитывается базовая линия ключевых метрик транзакции, автоматически настраиваются правила алертинга на основе отклонения от базовых линий (выявление аномалий), а также включаются преднастроенные правила алертинга по статическим порогам.

../images/195-kbt-alerting.png

Анализ действий пользователя

В новом разделе Ключевые веб-операции (модуль Цифровой опыт) можно детально анализировать действия пользователей на ваших веб-ресурсах.

../images/195-browser-key-business-transaction.png

Proto отслеживает исполнение ключевых веб-операции, например таких как нажатие кнопок добавления товара в корзину, просмотр важных страниц сайта и многие другие.

Обозначить действия пользователя как ключевые возможно в удобном конструкторе в UI нашей платформы.

Углубленный анализ ошибок

В модуле APM добавлен новый раздел Ошибки. Теперь ошибки группируются в группы на основе типов ошибки и названия сервиса, что ускоряет расследование и устранение ошибок.

../images/195-apm-errors.png

По каждой группе ошибок можно детально проанализировать:

  • количество ошибок в группе и его изменение за предыдущий период времени
  • распределение ошибок во времени
  • в каком бизнес-приложении и сервисе они возникали
  • дату и время первого и последнего появление ошибок
  • операции, сообщения об ошибке и стэк трейс ошибки
  • трейсы, содержащие эту ошибку

Группы ошибок в модуле Цифровой опыт

Детальный анализ ошибок также доступен и в модуле Цифровой опыт.

В новом разделе JS ошибки, JavaScript ошибки группируются на основе типов ошибки и названия веб-приложения, что ускоряет расследование и устранение ошибок.

Обновление модуля APM

  • Дашборд сервиса.

    ../images/195-service-dashboard.png

    Дашборд сервиса претерпел существенные изменения для еще большего ускорения расследования инцидентов. Теперь для каждого сервиса представлены следующие данные:

    • Критичные проблемы и предупреждения (со сравнением показателей за предыдущий период)
    • SLA (со сравнением показателя за предыдущий период)
    • Количество транзакций сервиса, количество и процент ошибок, время транзакций (со сравнением показателей за предыдущий период)
    • Здоровье хостов (с цветовой индикацией и возможностью по клику перейти на дашборд хоста)

    Добавлены таблицы с Топ-5 времязатратных транзакций и Топ-5 групп ошибок, с возможностью по клику перейти к дальнейшему анализу.

    Обновлен виджет APDEX для детального анализа распределения диапазонов значений.

    Обновлен дашборд Эндпоинта.

    ../images/195-endpoint-dashboard.png

  • Трейсинг.

    ../images/195-span-details.png

    Улучшено отображение деталей спанов в просмотре трейса:

    • Добавлена новая секция с ключевыми деталями спана
    • Добавлен поиск по имени и значению тегов
    • Теги сгруппированы в секции
  • Дашборд Kubernetes.

    На дашборде Kubernetes кластера теперь отображается список Kubernetes неймспейсов.

    ../images/195-k8s-cluster-namespace.png

Обновление модуля Инфраструктура

Добавлена возможность автоматического определения здоровья хостов с отображением на виджете с цветовой индикацией.

../images/195-health-hosts-treemap.png

Улучшения и изменения ✨

  • Новые опции конфигурации линейной диаграммы – возможность задания диапазонов значений и их наименований. ../images/195-line-chart-ranges.png

  • Добавлена опция скрытия/показа графиков при анализе трейсов ../images/195-hide-charts.png

  • Добавлена возможность настройки message_thread_id для каналов оповещения об алертах типа Telegram – позволяет маршрутизировать алерты в группы с включенными топиками (форум) ../images/195-message-thread-telegram.png

  • Маркер релиза теперь отображается на дашборде сервиса с учетом названия сервиса.

  • Новые опции конфигурации графиков и виджетов:

    Таблица.

    • Транспонирование таблицы
    • Скрытие/показ заголовка таблицы
    • Задание подсказок для колонок таблицы (при наведении мыши на название заголовка показывается подсказка)

    Линейная диаграмма (Line), Диаграмма с областями (Area), Столбчатая диаграмма (Bar)

    • Для этих типов графиков добавлены опции вывода одного из трех типов значений в заголовке виджета:
      • сумма всех значений
      • среднее значение без учета нулевых значений
      • среднее значение с учетов всех значений, включая нулевые
    • Задание произвольных цветов для серий данных

    Столбчатая диаграмма (Bar)

    • В режиме горизонтальной диаграммы появилась опция показа процентов

    • Появилась опция расчета процентов – от максимума или от среднего

      ../images/195-bar-chart-options.png

    • Показ ссылки на сервис, хост, бизнес-приложение и тд.

    Круговая диаграмма (Pie)

    • Опция отображения таблицы со значениями и процентами рядом с диаграммой
    • Скрытие/показ названий сегментов диаграммы

Инструкция по обновлению с версии 194

Для Заказчиков с single host инсталляцией

Необходимо использовать новый файл docker-compose-195.yaml, изменений в .env файле не требуется.

В случае каких-либо сложностей, обратитесь к основной инструкции по установке на новый сервер или команде поддержки партнера или вендора.

  1. Скачайте файл protoobp-backend-dist-singlehost-195.tar.gz:

    curl --header "PRIVATE-TOKEN:<your_token>"  "https://git.proto.group/api/v4/projects/125/packages/generic/protoobp-backend-dist/195/protoobp-backend-dist-singlehost-195.tar.gz" --output protoobp-backend-dist-singlehost-195.tar.gz
    

    где <your_token> – ваш пароль, указанный в лицензионном сертификате, полученном ранее от вендора.

  2. Распакуйте содержимое архива в папку с существующей инсталляцией (по умолчанию /opt/protoobp):

    tar -xzvf protoobp-backend-dist-singlehost-195.tar.gz -C /opt/protoobp
    
  3. Команды ниже рекомендуется выполнять, переключившись на привилегированную учетную запись (ниже команды будут указаны уже без префикса sudo):

    sudo su
    
  4. Перейдите в каталог продукта (/opt/protoobp) и выполните pull новых образов:

    cd /opt/protoobp && docker compose -f docker-compose-195.yaml pull
    

    Дождитесь успешного скачивания новых образов.

  5. Важно. В случае использования собственных SSL-сертификатов, измените файл docker-compose-195.yaml – раскомментируйте соответстующие строки для сервисов proto-nginx и proto-auth.

  6. Важно. В случае использования настроек SSO, измените файл docker-compose-195.yaml – раскомментируйте или измените соответстующие строки для сервиса proto-auth.

  7. Остановите предыдущую версию продукта:

    docker compose -f docker-compose-194.yaml down
    
  8. Запустите новую версию продукта:

    docker compose -f docker-compose-195.yaml up -d
    

    При первом запуске контейнеры proto-storage, proto-data-aggregator, proto-trace-processor и proto-metric-receiver инициализируются, после чего перезапускаются, что ведет к ошибке в выводе docker compose – это нормальная ситуация, поэтому в случае появления ошибки при первом запуске, отмените выполнение текущей команды (CTRL+c) повторите команду:

    docker compose -f docker-compose-195.yaml up -d
    

    Запуск всех компонентов может занять 2-4 минуты. После сообщения об успешном запуске всех контейнеров, перейдите в браузере по адресу, указанному в UI_URL (адрес сервера).

Для Заказчиков с multi host инсталляцией или версией <194

Инструкции по обновлению будут предоставлены контактными лицами со стороны поддержки партнера или вендора.