Как мне обрабатывать сообщения о происшествиях / инцидентах в Nagios?
Я только начал использовать Nagios, и мне нравится, что моя команда может распознавать проблемы, но я еще не нашел способа записать решения, которые используются для устранения проблем. Есть ли инструмент, который регистрирует оповещения Nagios и предоставляет возможность завершать посмертные и регистрировать решения, чтобы, когда кто-то сталкивался с подобными проблемами, он мог ссылаться на зарегистрированные данные?
3 ответа
Честно говоря, я не думаю, что попытка собрать эту информацию во время ошибки полезна. Вы напряжены, возможно, все еще сонливы, по крайней мере, вы будете в режиме "сражайся или беги", который не способствует написанию хорошей документации. Nagios уже имеет возможность записывать быстрые заметки в сервисе (либо как часть подтверждения, либо как отдельную заметку, которую вы прикрепляете к сервису / хосту); их можно использовать как часть вскрытия, которое вы должны делать на досуге после чрезвычайной ситуации, а затем включить в более структурированную, полезную и лучше написанную часть документации, которая записана в вики и связана с самой службой в Нагиосе (через notes_url
поле).
Посмотрите на обработчики событий. Все, что вам нужно сделать, это написать скрипт для обработки события и зарегистрировать свое решение в системе отслеживания проблем (мне нравится Redmine).
Где я работаю, мы делаем это наоборот.
Мы используем систему тикетов TopDesk (на самом деле это не имеет значения). Всякий раз, когда в Icinga (nagios-fork) появляется предупреждение, это создает заявку через HTTP-запрос к TopDesk-серверу.
Поэтому я думаю, что проще разрешить nagios отправлять предупреждения / ошибки по почте, смс и через систему тикетов, а затем использовать ее для отслеживания предпринятых действий.