Как контролировать задержку REST API с помощью Prometheus и Grafana
Я хотел бы отслеживать задержки обработки запросов на моем сервере Tomcat. Было бы неплохо выполнить некоторые предупреждения, основанные на этом позже. Я настроил клапан Tomcat с шаблоном%D, чтобы он регистрировал время обработки каждого запроса в файле журнала доступа. Как правильно рассчитать 50, 90, 99 процентилей из этих строк? Я уже настроил Prometheus и Grafana для базовых показателей хоста (cpu/mem,hdd), но мне не ясно, как правильно рассчитать процентили и отобразить их с помощью prometheus/grafana? Идея состоит в том, чтобы обнаружить сбой в работе приложения и отреагировать до того, как он перестанет отвечать на запросы. Спасибо всем заранее!
1 ответ
Вы можете использовать мой tomcat_exporter для этого, настроив фильтр для метрик времени отклика. В качестве альтернативы вы можете реализовать подобный фильтр самостоятельно.