Как лучше всего настроить Prometheus + Alertmanager с HA?

У меня есть решение для мониторинга, которое использует Prometheus в качестве парсера и хранилища данных, Grafana в качестве визуализатора и Alertmanager в качестве инструмента оповещения. Все это работает на одном сервере.

Однако с этим подходом есть проблема. Если сервер, на котором размещено все это, выйдет из строя, я практически потеряю все данные мониторинга, поэтому, если после этого что-то произойдет, я никогда не узнаю об этом.

Я предполагаю, что лучший способ справиться с этим — иметь два сервера, чтобы они каким-то образом делились одной и той же информацией, и я был бы уведомлен о том, что узел в этой настройке не работает. Однако как мне настроить Prometheus и Grafana, чтобы они не были единой точкой отказа?

Насколько я знаю, я могу настроить кластер Alertmanager, но это не решит проблему, когда один экземпляр Prometheus не работает, поэтому мне придется как-то его реплицировать.

0 ответов

Другие вопросы по тегам