Расширенная конфигурация Proto Observability Platform

На этой странице:

Конфигурация срока хранения данных

По умолчанию метрики и трейсы хранятся заданное время, указанное ниже. Для изменения срока хранения данных в .env файле добавьте необходимые переменные и укажите значения:

Переменная Значение по умолчанию Домен Агрегация Назначение
POBP_DATA_RETENTION_METRICS 2w Инфраструктурные метрики и метрики сервисов в формате Prometheus инфраструктурные метрики (для версии 199+)
POBP_DATA_RETENTION_DB_RAW_RUM_DAYS 7 RUM сырые данные мониторинга цифрового опыта (без аггрегации)
POBP_DATA_RETENTION_DB_RAW_TRACES_DAYS 1 APM сырые трейсы (без аггрегации), в том числе трейсы сессий цифрового опыта
POBP_DATA_RETENTION_DB_RUM_DAYS 7 RUM минута данные мониторинга цифрового опыта (минутная аггрегация)
POBP_DATA_RETENTION_DB_TRACES_DAYS 7 APM общие трейсы (базовая агрегация)
POBP_DATA_RETENTION_DB_TRACES_AGG_DAYS 30 APM общие агрегированные трейсы (общая агрегация)
POBP_DATA_RETENTION_DB_TRACES_AGG_MINUTE_DAYS 7 APM минута метрики и данные по трейсам (минутная аггрегация)
POBP_DATA_RETENTION_DB_TRACES_AGG_HOUR_DAYS 30 APM час метрики и данные по трейсам (часовая аггрегация)
POBP_DATA_RETENTION_DB_TRACES_AGG_DAY_DAYS 60 APM день метрики и данные по трейсам (дневная аггрегация)
POBP_DATA_RETENTION_DB_DBMMETRICS_DAYS 7 Metrics метрики БД (dbmmetrics)
POBP_DATA_RETENTION_DB_PROCESS_DAYS 15 APM метрики по бизнес-процессам
POBP_DATA_RETENTION_EVENTS_DAYS 30 события, собираемые агентами
POBP_DATA_RETENTION_ALERTS_DAYS 90 сработавшие алерты
POBP_CORE_RECORD_DATA_TTL 2 срок хранения записей в OpenSearch (дней)
POBP_CORE_METRICS_DATA_TTL 2 срок хранения метрик в OpenSearch (дней)

Примите изменения конфигурации выполнив:

docker compose -f docker-compose-199.yaml up -d

Изменения значения APDEX T

Proto Observability Platform использует методику APDEX для вычисления интегрального показателя здоровья сервисов.

APDEX (Application Performance Index) – это индекс производительности, который отражает, насколько пользователи удовлетворены скоростью работы информационной системы.

Значение метрики APDEX рассчитывается по каждому подключенному сервису, отображается на встроенных дашбордах сервисов и используется в правилах алертинга, доступных в системе из коробки.

Для вычисления значения метрики APDEX все транзакции делятся на три группы:

  • Satisfied:
    • удовлетворительные, то есть завершенные без ошибок и с временем исполнения меньшим, чем пороговое значение APDEX T;
  • Tolerating:
    • приемлемые, то есть завершенные без ошибок и с временем исполнения меньшим, чем 4 * APDEX T;
  • Frustrated:
    • неудовлетворительные, то есть завершенные с ошибкой или с временем исполнения большим, чем 4 * APDEX T.

Далее используется формула для вычисления значения APDEX за заданный период по формуле:

APDEX

Где:

  • SatisfiedCount – количество удовлетворительных транзакций за период;
  • ToleratingCount – количество приемлемых транзакций за период;
  • FrustratedCount – количество неудовлетворительных транзакций за период;
  • TotalSamples – общее количество транзакций за период.

Значение метрики APDEX для заданного сервиса принимает значения от 0 (неприемлемый пользовательский опыт, 0 пользователей удовлетворены) до 1 (отличный пользовательский опыт, все пользователи удовлетворены).

APDEX Gauge

Настройка APDEX порогов с версии 199 выполняется через веб-интерфейс, а не через конфигурационные файлы.

Путь: APM → Настройки → APDEX.

Доступные действия:

  • Создать APDEX порог для сервиса.
  • Отредактировать уже созданный порог.

Поля формы:

  • Имя сервиса — выберите из списка или введите вручную.
  • APDEX T (мс) — порог времени отклика, определяющий удовлетворительный пользовательский опыт. При создании нового порога значение по умолчанию: 500 мс (0.5 с).

Настройка APDEX T