Программное обеспечение для записи уровня обслуживания

Я предоставляю облачный сервис (SaaS) на компьютере с Ubuntu и скоро столкнусь с соглашениями об уровне обслуживания (SLA). Т.е. нам нужно будет посмотреть, какой уровень обслуживания мы можем предоставить (возможно, на ежедневной или еженедельной основе), а затем иметь надежную запись доступности, чтобы доказать уровень обслуживания в определенный период времени.

На данный момент будет достаточно записать доступность непосредственно на сервере, который также предоставляет услугу. Тем не менее, мне не удалось найти решение, которое будет фиксировать доступность сервиса и "возвращать" индекс доступности за день, месяц и год.

Задача (как я себе это представлял) довольно проста: запрашивать ресурс HTTP/S каждые (например) 20 секунд, проверять ключевое слово в содержимом, создавать запись в лог-файле и (необязательно) вычислять процент доступности из него и сохранить это к столу. В идеале, было бы также возможно определить основное время (например, с 9 утра до 5 вечера) и рассчитать отдельные проценты для этого времени.

Технически, это не должно быть разницей, если такое программное обеспечение работает на сервисном сервере или на сервере мониторинга (конечно, это имеет значение с точки зрения точности записей простоя).

  • Я уже использую monit для мониторинга сервера, но файлы журналов, кажется, неуместны, чтобы вычислять проценты доступности из него.
  • Я также рассмотрел простой сценарий, который просто пишет файл журнала, но я предполагаю, что есть, по крайней мере, некоторые программные пакеты, которые сделают работу намного лучше.

Спасибо за любые идеи. И, пожалуйста, дайте мне знать, если я совершенно не прав. SLA - это новая территория для меня, и я пока не задумываюсь об этом.

1 ответ

Для этого есть облачные решения...

И, конечно, решения для мониторинга старой школы, которые также рассчитывают эти проценты. OpenNMS делает это довольно хорошо.

Пример сообщения:

Все сервисы недоступны на узле General - ppro. Созданы новые записи об отключениях, и вычисления доступности уровня обслуживания будут затронуты до тех пор, пока это отключение не будет устранено.

Другие вопросы по тегам