Простые способы постоянного мониторинга работоспособности многих серверов?

Я использую несколько веб-прокси-серверов, работающих на CentOS, и ищу простой способ постоянного мониторинга работоспособности серверов (как быстро они отвечают на веб-запросы, как быстро загружаются веб-страницы и т. Д.)

Я думал о чем-то с веб-интерфейсом (возможно, с PHP-скриптом?) Или с использованием инструментов из командной строки bash. Какой простой способ сделать это? Спасибо!

9 ответов

Решение

Nagios работает очень хорошо

Все упомянули Nagios - это здорово, но может не дать вам всего, что вам нужно.

Лучшим вариантом для того, что вы ищете, может быть OpsView - который на самом деле является просто оберткой вокруг nagios, но добавляет графики сервисов с течением времени - так что вы можете видеть, что ваши серверы делали за прошедший день, неделю, месяц или год,

Однако для настройки Nagios и OpsView требуется некоторое время.

Один очень полезный и чрезвычайно простой в установке ответ - munin. Установка munin по умолчанию дает вам простую веб-страницу с графиками всех видов низкоуровневых метрик сервера, например, сколько вашей памяти используется для кэширования или активно приложениями. Сколько inode использует ваша файловая система, скорость дискового ввода-вывода, нагрузка на процессор в зависимости от типа - и т. Д. Он даже будет отслеживать apache или mysql за вас - сколько процессов делают что и в данный момент. Единственное, что я не думаю, что это сделает, это проверить фактическое время отклика ваших веб-страниц - но даже это не будет слишком сложно настроить.

Я рекомендую Zenoss Core (бесплатно). У них есть ZenPacks для извлечения пользовательской информации, которую нужно отслеживать. Прекрасно работает в моей среде Linux/Windows.

Nagios отлично подходит для небольших и средних сетей.

Предполагается, что OpenNMS станет золотым стандартом бесплатного мониторинга для крупной инфраструктуры (тысячи хостов).

Одним из наиболее распространенных инструментов, используемых для этого, является Nagios с открытым исходным кодом, имеющий широкий набор плагинов для мониторинга, и если вам не нравится ни один из них, он может запустить любой сценарий bash, который вам понравится, и обработать ответ. Он отображает все данные через веб-интерфейс.

Конфигурация nagios может быть довольно сложной и занять некоторое время, чтобы привыкнуть, но как только вы там, это фантастический инструмент. Есть также ряд инструментов, которые помогут в его настройке, таких как http://nagiosconfig.com/.

Обычно я рассматриваю здоровье как вентиляторы, мощность, температуру и т. Д. Если вы используете серверы dell, в этом может помочь open management. Nagios позволяет вам писать свои собственные плагины на любом языке, он просто использует состояние выхода скрипта. Можно также связать открытое управление с Nagios.

У Nagios есть веб-интерфейс, и есть веб-интерфейсы, которые позволяют вам настроить Nagios. Но настроить Nagios не так просто в целом.

Как упоминалось ранее, мне нравятся Nagios, Cacti и Munin. Еще один факт, о котором не говорилось, - это Monit.

Я запускаю Nagios & Cacti, оба опрашивают через SNMP, и мне еще ничего не нужно отслеживать, иногда мне приходится писать свой собственный модуль php/perl, чтобы сделать это, но ничто не было "неуправляемым".

Даже с помощью PHP+CURL я смог контролировать вход в систему на портале OWA нашего сервера Exchange, проверить, действительно ли он вошел в систему и может просматривать входящие сообщения, и, если в пути произойдет сбой, уведомить об этом инженера.

Еще одна бесплатная альтернатива с открытым исходным кодом, которая имеет агентный мониторинг, - это Zabbix.

Другие вопросы по тегам