Расширенная конфигурация Proto Observability Platform

На этой странице:

Конфигурация срока хранения данных

По умолчанию метрики и трейсы хранятся заданное время, указанное ниже. Для изменения срока хранения данных в .env файле добавьте необходимые переменные и укажите значения:

# значения по умолчанию
POBP_DATA_RETENTION_METRICS=2w                    # инфраструктурные метрики (для версии 199+)
POBP_DATA_RETENTION_DB_RAW_RUM_DAYS=7             # данные мониторинга цифрового опыта (без аггрегации) 
POBP_DATA_RETENTION_DB_RUM_DAYS=7                 # данные мониторинга цифрового опыта (минутная аггрегация)
POBP_DATA_RETENTION_DB_RAW_TRACES_DAYS=1          # трейсы (без аггрегации), в том числе трейсы сессий цифрового опыта     
POBP_DATA_RETENTION_DB_TRACES_AGG_MINUTE_DAYS=7   # метрики и данные по трейсам (минутная аггрегация) (для версии 199+)
POBP_DATA_RETENTION_DB_TRACES_AGG_HOUR_DAYS=30    # метрики и данные по трейсам (часовая аггрегация)
POBP_DATA_RETENTION_DB_PROCESS_DAYS=15            # метрики по бизнес-процессам
POBP_DATA_RETENTION_EVENTS_DAYS=30                # события, собираемые агентами
POBP_DATA_RETENTION_ALERTS_DAYS=90                # сработавшие алерты
POBP_CORE_RECORD_DATA_TTL=14                      # срок хранения записей в OpenSearch (дней)
POBP_CORE_METRICS_DATA_TTL=14                     # срок хранения метрик в OpenSearch (дней)

Примите изменения конфигурации выполнив:

docker compose -f docker-compose-198.yaml up -d

Изменения значения APDEX T

Proto Observability Platform использует методику APDEX для вычисления интегрального показателя здоровья сервисов.

APDEX (Application Performance Index) – это индекс производительности, который отражает, насколько пользователи удовлетворены скоростью работы информационной системы.

Значение метрики APDEX рассчитывается по каждому подключенному сервису, отображается на встроенных дашбордах сервисов и используется в правилах алертинга, доступных в системе из коробки.

Для вычисления значения метрики APDEX все транзакции делятся на три группы:

  • Satisfied:
    • удовлетворительные, то есть завершенные без ошибок и с временем исполнения меньшим, чем пороговое значение APDEX T;
  • Tolerating:
    • приемлемые, то есть завершенные без ошибок и с временем исполнения меньшим, чем 4 * APDEX T;
  • Frustrated:
    • неудовлетворительные, то есть завершенные с ошибкой или с временем исполнения большим, чем 4 * APDEX T.

Далее используется формула для вычисления значения APDEX за заданный период по формуле:

APDEX

Где:

  • SatisfiedCount – количество удовлетворительных транзакций за период;
  • ToleratingCount – количество приемлемых транзакций за период;
  • FrustratedCount – количество неудовлетворительных транзакций за период;
  • TotalSamples – общее количество транзакций за период.

Значение метрики APDEX для заданного сервиса принимает значения от 0 (неприемлемый пользовательский опыт, 0 пользователей удовлетворены) до 1 (отличный пользовательский опыт, все пользователи удовлетворены).

APDEX Gauge

Значение APDEX T в Proto Observability Platform равно 500 мс по умолчанию.

Есть возможность изменить значение по умолчанию для всех сервисов, а также значение для каждого сервиса по отдельности. На данный момент это делается в конфигурационном файле на бэкенд сервере, который нужно создать в папке /opt/protoobp/config/service-apdex-threshold.yml. В файле указывается название сервиса и значение APDEX T в миллисекундах.

# значение по умолчания 500 мс
default: 500
# примеры:
# пороговое значение сервиса "tomcat" 1 секунда
# tomcat: 1000
# пороговое значение сервиса "springboot1" 50 мс
# springboot1: 50