"Что просходит?" монитор производительности сервера

После просмотра некоторой ветки о программном обеспечении для мониторинга серверов у меня возникает простой вопрос:

Какой из инструментов мониторинга сервера следует использовать для автоматического обнаружения "нештатных" ситуаций с рекомендациями по их устранению?

Я ищу программное обеспечение, которое проверяет производительность системы после установки и вычисляет некоторые средние значения нагрузки (память, процессор и т. Д.). И когда что-то происходит (загрузка процессора увеличивается до 20%), он пытается определить причину этого. Если это apache, он должен проверить журналы доступа. Если mysql, он должен проверить логи mysql и сказать мне, что происходит. Это потому, что какой-то пользователь декодирует много изображений, я хотел бы знать, какая команда выполняется, когда и имя пользователя. То же самое касается использования диска, памяти, количества процессов, потоков и так далее.

В идеале, это программное обеспечение должно периодически проверять систему и сообщать о проблемах: ошибки в журнале ошибок PHP, устаревшие пакеты, уязвимости безопасности.

Другими словами, я ищу программное обеспечение, которое будет поддерживать мой простой сервер Debian/Apache/PHP/MySQL, не заставляя меня ежедневно следить за графиками.

6 ответов

Существует множество подобных программ, но стоит отметить, что вы должны запускать их на другом хосте, или у вас есть высокий риск не получать уведомления, если что-то пойдет не так.

В качестве примера мы используем комбинацию nagios (обрабатывает весь мониторинг и оповещения, другими словами, он отвечает за то, чтобы разбудить кого-то, когда есть необходимость оператора, смотрящего на что-то) и cacti (также может делать оповещения, но мы просто используйте его для сбора и агрегирования различных метрик, начиная от сетевого трафика до загрузки системы и статистики спама в электронной почте).

Когда придет время, когда вы получите предупреждение (от nagios cacti zabbix) с какими-то данными о производительности, на которые нужно посмотреть (cacti, zabbix, другие это сделают), как правило, помогут вам в диагностике проблемы.

В обычном стеке LAMP, который вы описываете в двух наиболее распространенных проблемных ситуациях (по моему опыту, по крайней мере), сервер HTTP или SQL не отвечает вообще или в течение разумного времени (это проверяет зонд nagios) или средняя нагрузка на Система идет ужасно высоко.

Эти две проверки, вероятно, поймут 95% ваших проблем, но есть много других вещей, которые вы должны искать - примеры:

  1. Apache, постоянно работающий с максимальным количеством настроенных процессов / потоков, означает, что ваш сервер не справляется с нагрузкой
  2. система работает нормально, но с отказавшим диском в RAID (вы не знаете, как часто подобные вещи остаются незамеченными месяцами или, по крайней мере, до следующего отказа диска;)

Почти все продукты, которые вы можете найти, смогут отслеживать и графически отображать все, что вы можете на них бросить, обычно вы можете расширять их с помощью простых сценариев оболочки, коротких программ и прочего, в дополнение к включенным в них инструментам и вездесущему SNMP.,

В отличие от Zabbix - упомянутого Maxwell - почтенный нагиос (и это сравнительно недавний форк, исинга). Эта инфраструктура существует уже более десяти лет и является невероятно стабильной - единственным недостатком является ее установка и настройка, которая требует гораздо больше времени (особенно в первый раз), чем система, поддерживаемая коммерческой компанией, например Zabbix.

Конечно, оба имеют свое место в экосистеме - поэтому я бы посоветовал вам попробовать оба. Как уже упоминалось в моем комментарии, хотя: чем более тщательный тип мониторинга вы намереваетесь выполнять, тем больше вы должны ожидать затрат усилий, будь то на самом деле написание собственных плагинов / скриптов или поиск / загрузка / изменение работы других пользователей.,

Удачи!

Установка Nagios

Nagios - это монитор хоста и сервиса, предназначенный для информирования вас о проблемах в сети до того, как это сделают ваши клиенты, конечные пользователи или менеджеры. Он был разработан для работы под операционной системой Linux, но прекрасно работает и в большинстве вариантов. Демон мониторинга запускает периодические проверки хостов и сервисов, указанных вами с помощью внешних плагинов, которые возвращают информацию о состоянии в Nagios. При возникновении проблем демон может отправлять уведомления административным контактам различными способами (электронная почта, мгновенные сообщения, SMS и т. Д.). Установка Nagios на ваш сервер поможет повысить надежность вашего сервера.

Nagios обладает множеством функций, что делает его очень мощным средством мониторинга. Ниже перечислены некоторые из основных функций. Мониторинг сетевых служб (SMTP, POP3, HTTP, NNTP, PING и т. Д.) Мониторинг ресурсов хоста (загрузка процессора, использование диска и памяти, запущенные процессы, файлы журнала и т. Д.) Мониторинг факторов окружающей среды, таких как температура. Запланированное время простоя для подавления уведомлений хоста и сервисов в периоды запланированных отключений. Простая конструкция плагина, которая позволяет пользователям легко разрабатывать свои собственные тесты хостов и сервисов. Возможность определять иерархию сетевых хостов, позволяя обнаруживать и различать хосты, которые недоступны и недоступны. Поддержка реализации избыточных и распределенных серверов мониторинга. Возможность подтверждения проблем через веб-интерфейс. Уведомления о контактах при возникновении проблем с обслуживанием или хостом и их устранении (по электронной почте, через пейджер или другим способом, определяемым пользователем). Опциональная эскалация хоста. и сервисные уведомления для разных групп контактов. Возможность определять обработчики событий, которые будут запускаться во время сервиса или хоста. события для упреждающего разрешения проблем. Внешний командный интерфейс, позволяющий оперативно вносить изменения в поведение мониторинга и уведомлений посредством использования обработчиков событий, веб-интерфейса и сторонних приложений. Сохранение статуса хоста и службы при перезапуске программы.

Взгляните на Zenoss Core, бесплатное и очень универсальное программное обеспечение для мониторинга, которое многие компании используют для мониторинга своих сетей. Это легко настроить и начать с.

Многие типы мониторинга и оповещения встроены, в том числе графики истории. Для его расширения можно установить так называемые ZenPacks. Также можно добавить плагины Nagios.

Это может быть именно то, что вам нужно.

Opsview - это полностью интегрированный инструмент мониторинга, который включает в себя популярное программное обеспечение с открытым исходным кодом, включая Nagios Core, Nagvis, Net-SNMP и RRDtool.

Веб-платформа Catalyst предоставляет расширяемый пользовательский интерфейс для мониторинга и настройки. Серверное программное обеспечение Opsview работает на Linux и Solaris 10. Оно будет контролировать все распространенные операционные системы, включая Linux, AIX, Solaris и Windows.

Используя тысячи доступных плагинов Nagios, Opsview может контролировать практически любое устройство, систему или программный компонент.

Opview рассматривает все аспекты вашей ИТ-среды, в том числе то, как они работают с вашими бизнес-процессами.

Решение для мониторинга Zabbix может отслеживать все, что вы хотите, и соответствующим образом инициировать действия, например, действия могут быть выполнены при выполнении сценария, который обрабатывает журналы и при необходимости возвращает результат. Также вы можете инициировать действие при выполнении одного или нескольких условий (например, вывод сценария синтаксического анализа журнала, показывающего ошибку и загрузку процессора, например, более 40%).

Другие вопросы по тегам