Мониторинг нарушений SLA на основе событий? (например, задержка файла)

Наши действующие соглашения об уровне обслуживания требуют доставки файла в течение определенного временного окна. У нас довольно мало таких файлов, сгенерированных в разное время в течение дня.

Я знаю о сайтах внешнего мониторинга, таких как Site24x7, которые будут отслеживать сбои в работе определенных служб. Например, если наш FTP-сервер выйдет из строя, мы получим уведомление.

Но существует ли какое-либо программное обеспечение хост-службы или серверное программное обеспечение, которое может отслеживать наши процессы и генерировать уведомления, когда (a) ожидаемое событие задерживается дольше, чем назначенное время, и (b) когда ожидаемое событие наконец происходит?

Я ищу уведомление типа "Файл XYZZY.DAT должен был быть опубликован 91 минуту назад, но его до сих пор нет".

1 ответ

Любой обычный инструмент мониторинга может сделать это. Посмотрите Zabbix, Zenoss, Icinga... или даже глупые домашние сценарии. Для Zabbix кажется, что вы можете использовать trapper, чтобы сообщить zabbix о событии из скрипта, доставляющего файлы, затем вы можете объединить его с простыми проверками, чтобы убедиться, что ваш сервер, на котором размещены эти файлы, удаленно доступен. Все упомянутые приложения имеют панель управления, но также могут отправлять оповещения на почту, телефоны, страницы и так далее.

Другие вопросы по тегам