Программное обеспечение для записи уровня обслуживания
Я предоставляю облачный сервис (SaaS) на компьютере с Ubuntu и скоро столкнусь с соглашениями об уровне обслуживания (SLA). Т.е. нам нужно будет посмотреть, какой уровень обслуживания мы можем предоставить (возможно, на ежедневной или еженедельной основе), а затем иметь надежную запись доступности, чтобы доказать уровень обслуживания в определенный период времени.
На данный момент будет достаточно записать доступность непосредственно на сервере, который также предоставляет услугу. Тем не менее, мне не удалось найти решение, которое будет фиксировать доступность сервиса и "возвращать" индекс доступности за день, месяц и год.
Задача (как я себе это представлял) довольно проста: запрашивать ресурс HTTP/S каждые (например) 20 секунд, проверять ключевое слово в содержимом, создавать запись в лог-файле и (необязательно) вычислять процент доступности из него и сохранить это к столу. В идеале, было бы также возможно определить основное время (например, с 9 утра до 5 вечера) и рассчитать отдельные проценты для этого времени.
Технически, это не должно быть разницей, если такое программное обеспечение работает на сервисном сервере или на сервере мониторинга (конечно, это имеет значение с точки зрения точности записей простоя).
- Я уже использую monit для мониторинга сервера, но файлы журналов, кажется, неуместны, чтобы вычислять проценты доступности из него.
- Я также рассмотрел простой сценарий, который просто пишет файл журнала, но я предполагаю, что есть, по крайней мере, некоторые программные пакеты, которые сделают работу намного лучше.
Спасибо за любые идеи. И, пожалуйста, дайте мне знать, если я совершенно не прав. SLA - это новая территория для меня, и я пока не задумываюсь об этом.
1 ответ
Для этого есть облачные решения...
И, конечно, решения для мониторинга старой школы, которые также рассчитывают эти проценты. OpenNMS делает это довольно хорошо.
Пример сообщения:
Все сервисы недоступны на узле General - ppro. Созданы новые записи об отключениях, и вычисления доступности уровня обслуживания будут затронуты до тех пор, пока это отключение не будет устранено.