Автоматический мониторинг новых облачных серверов с использованием Open Monitoring Distro (OMD)?

Я потратил некоторое время на то, чтобы разобраться с использованием Nagios, Check_mk и некоторых других очень полезных инструментов, установленных как часть пакета OMD.

WATO особенно полезен для администрирования всех наших статических серверов на базе Windows и Linux через графический интерфейс, если агент check_mk установлен вручную.

Я хотел спросить, как лучше всего автоматизировать весь этот процесс мониторинга? Или даже если это можно сделать?

Мы будем использовать рецепты шеф-повара для регулярной подготовки новых серверов и частого уничтожения других. Если мы продолжим использовать Nagios / Check_mk, то крайне важно, чтобы усилия администратора были минимальными для отслеживания и мониторинга нашей инфраструктуры.

Большое спасибо за вашу помощь. Стив

1 ответ

Решение

Highlevel, есть два способа:

  • Сделайте так, чтобы шеф-повар записал действительные файлы конфигурации Check_MK (это уже было сделано), и пусть он запускает инвентаризацию + перезагрузки через автоматизацию WATO. Это, вероятно, более прозрачно.
  • Сделайте так, чтобы Check_MK читал хосты из вашей CMDB (если вы запустили профессиональную настройку, она была бы одна...) или из конфигурации Chef. Это возможно, конфигурация Check_MK позволяет вам практически все, что позволяет Python. Таким образом, вы можете читать данные из LDAP, некоторого API, конфигурации Chef или простого файла. Для меня это более чистый подход, поскольку он имеет более прямой интерфейс для передачи данных.

Я думаю, что в конечном итоге первый путь будет работать лучше для вас, так как он больше ориентирован на ВТО. Я бы все равно выбрал второй и подключился к списку EC2 vm и тому подобное.

Гибрид возможен, т. Е. Некоторые демоны прослушивают такие события, как создание виртуальных машин, и записывают конфигурацию в папку WATO только для чтения.

Примечание. Было бы очень глупо не проверять любой такой источник данных. Просто потому, что некоторые орехи "Инфраструктура как код" добавляют ошибку (инфраструктуры) и удаляют 100% ваших виртуальных машин из Chef, их не следует немедленно удалять из мониторинга.

Удостоверьтесь, что это остается немного вне группы.

Документ 2010 года о динамическом взаимодействии Check_MK можно найти здесь: https://geni-orca.renci.org/trac/wiki/OMDeventhandlers

Он действительно старый, но хорошо излагает основные идеи.

Я сделал первое подтверждение концепции для интерфейса config-mgmt ---to ---- Check_MK. Не так хорошо, как хотелось бы, но ограничен моей скоростью / навыком написания Python.:)

Я использую это с ок. не облачные 70 серверов сейчас: https://bitbucket.org/darkfader/nagios/src/461992c2c5452807a37838ca99fd92977fcf96e1/check_mk/ino2cmk/ino2cmk.py?at=default

Другие вопросы по тегам