Расширенная конфигурация Proto Observability Platform
На этой странице:
Конфигурация срока хранения данных
По умолчанию метрики и трейсы хранятся заданное время, указанное ниже. Для изменения срока хранения данных в .env файле добавьте необходимые переменные и укажите значения:
# значения по умолчанию
POBP_DATA_RETENTION_METRICS=2w # инфраструктурные метрики (для версии 199+)
POBP_DATA_RETENTION_DB_RAW_RUM_DAYS=7 # данные мониторинга цифрового опыта (без аггрегации)
POBP_DATA_RETENTION_DB_RUM_DAYS=7 # данные мониторинга цифрового опыта (минутная аггрегация)
POBP_DATA_RETENTION_DB_RAW_TRACES_DAYS=1 # трейсы (без аггрегации), в том числе трейсы сессий цифрового опыта
POBP_DATA_RETENTION_DB_TRACES_AGG_MINUTE_DAYS=7 # метрики и данные по трейсам (минутная аггрегация) (для версии 199+)
POBP_DATA_RETENTION_DB_TRACES_AGG_HOUR_DAYS=30 # метрики и данные по трейсам (часовая аггрегация)
POBP_DATA_RETENTION_DB_PROCESS_DAYS=15 # метрики по бизнес-процессам
POBP_DATA_RETENTION_EVENTS_DAYS=30 # события, собираемые агентами
POBP_DATA_RETENTION_ALERTS_DAYS=90 # сработавшие алерты
POBP_CORE_RECORD_DATA_TTL=14 # срок хранения записей в OpenSearch (дней)
POBP_CORE_METRICS_DATA_TTL=14 # срок хранения метрик в OpenSearch (дней)
Примите изменения конфигурации выполнив:
docker compose -f docker-compose-198.yaml up -d
Изменения значения APDEX T
Proto Observability Platform использует методику APDEX для вычисления интегрального показателя здоровья сервисов.
APDEX (Application Performance Index) – это индекс производительности, который отражает, насколько пользователи удовлетворены скоростью работы информационной системы.
Значение метрики APDEX рассчитывается по каждому подключенному сервису, отображается на встроенных дашбордах сервисов и используется в правилах алертинга, доступных в системе из коробки.
Для вычисления значения метрики APDEX все транзакции делятся на три группы:
- Satisfied:
- удовлетворительные, то есть завершенные без ошибок и с временем исполнения меньшим, чем пороговое значение
APDEX T;
- удовлетворительные, то есть завершенные без ошибок и с временем исполнения меньшим, чем пороговое значение
- Tolerating:
- приемлемые, то есть завершенные без ошибок и с временем исполнения меньшим, чем
4 * APDEX T;
- приемлемые, то есть завершенные без ошибок и с временем исполнения меньшим, чем
- Frustrated:
- неудовлетворительные, то есть завершенные с ошибкой или с временем исполнения большим, чем
4 * APDEX T.
- неудовлетворительные, то есть завершенные с ошибкой или с временем исполнения большим, чем
Далее используется формула для вычисления значения APDEX за заданный период по формуле:
Где:
SatisfiedCount– количество удовлетворительных транзакций за период;ToleratingCount– количество приемлемых транзакций за период;FrustratedCount– количество неудовлетворительных транзакций за период;TotalSamples– общее количество транзакций за период.
Значение метрики APDEX для заданного сервиса принимает значения от 0 (неприемлемый пользовательский опыт, 0 пользователей удовлетворены) до 1 (отличный пользовательский опыт, все пользователи удовлетворены).
Значение APDEX T в Proto Observability Platform равно 500 мс по умолчанию.
Есть возможность изменить значение по умолчанию для всех сервисов, а также значение для каждого сервиса по отдельности. На данный момент это делается в конфигурационном файле на бэкенд сервере, который нужно создать в папке /opt/protoobp/config/service-apdex-threshold.yml. В файле указывается название сервиса и значение APDEX T в миллисекундах.
# значение по умолчания 500 мс
default: 500
# примеры:
# пороговое значение сервиса "tomcat" 1 секунда
# tomcat: 1000
# пороговое значение сервиса "springboot1" 50 мс
# springboot1: 50