Какой инструмент вы используете для мониторинга ваших серверов?

Более полный список инструментов мониторинга и их функций можно найти на этой странице Википедии.

Как говорится в вопросе, какие инструменты наиболее часто используются для этой задачи и каковы их сильные и слабые стороны?

73 ответа

Nagios в сочетании с nagvis (графика для демонстрации мониторинга)

связаны с почтой, Google Talk и Twitter.. так что вы не можете избежать мониторинга

его даже есть отличный плагин Firefox

Мы попробовали Диспетчер приложений, который работает на Java и MySQL. Это действительно мощный и простой в настройке из браузера. Это не так уж дорого.

В настоящее время мы используем SCOM от MS. Я не рекомендовал бы это никому!

Мы начали использовать мониторинг сервера Bijk.com - http://www.bijk.com/ еще несколько недель назад.

И мы рады простой установке и очень простому графическому интерфейсу и техническому обслуживанию - бесплатные оповещения по почте и SMS полезны для нас.

Мы используем hyperic - у него есть и версия с открытым исходным кодом, и коммерческая.

Он контролирует операционную систему (RHES 3, 4 и 5 + Ubuntu), Apache, MySql, JBoss, Tomcat, почтовые серверы, memcached и, вероятно, может отслеживать больше приложений. Никакой специальной настройки не требуется, все серверы были обнаружены с помощью автоматического обнаружения, даже если они были установлены в нетрадиционном месте. Он очень прост в использовании и настройке, вы можете управлять своими службами (запуск / остановка и т. Д.) И определять оповещения.

Минусы - Вам нужно настроить его для запуска при загрузке (для этого мы используем cron).

Мы используем AlertGrid, он идеально подходит для веб-приложений. В отличие от миллионов типичных мониторов dotcom, он не отслеживает производительность (время отклика и т. Д.) Извне, но позволяет отслеживать выполнение вашего кода и всех ваших пользовательских метрик / статистики, отправляя события изнутри вашего приложения. Как только вы начинаете отправлять события из своего приложения в AlertGrid, все настраивается с помощью приятного визуального редактора (100% веб), и нетехнические люди могут легко создавать свои собственные правила оповещения. Электронная почта, СМС, телефон и интернет-оповещения доступны.

Он имеет плагин для простого мониторинга сервера (windows), который устанавливается как служба, работает в фоновом режиме и генерирует события об использовании процессора, % свободной оперативной памяти и запущенных процессах. Требуется полминуты, чтобы установить, и это работает! Единственное предостережение в том, что машина должна иметь подключение к интернету.

Я использую Sysmon в течение нескольких лет. Есть несколько современных сервисов, которые он не отслеживает, но он легко компилируется на большинстве *nix-платформ, практически не имеет зависимостей, чрезвычайно легок, может легко контролировать очень большое количество устройств и сервисов, может обрабатывать сложные сети макеты (включая кольцевые топологии) и мониторинг отработки отказа. Это в основном соглашение с конфигурационным файлом, но формат довольно прост (основан на plist/css).

Пожалуйста, проверьте Verax NMS. Преимущества:

  • Сервис-ориентированный подход
  • Серверы мониторинга, а также сети, сетевые устройства (например, коммутаторы, маршрутизаторы), инфраструктура центра обработки данных (например, источник питания, кондиционер) и приложения (например, www и серверы приложений, базы данных)
  • Богатая библиотека плагинов и SDK для новых
  • Поддержка виртуализации
  • Расширенные правила корреляции событий
  • Расширенные отчеты (соответствие SLA)

Я работал со многими системами мониторинга во многих местах. Большинство из них уже упоминалось. Вот несколько, которые еще не были:

СМАРТС - теперь принадлежит EMC. На самом деле это лучшая вещь для коренной причины. Это не дешево, и поддержка может перестать быть хорошей, поскольку она принадлежит EMC. Нам посчастливилось поработать с основателями компании, чтобы реализовать ее.

Старший брат. Хорошая и простая, но плохая лицензия. Это также самый уродливый веб-интерфейс, который я когда-либо видел, поэтому мне пришлось его переписать. Никогда не заставлял старшую сестру работать.

HP Openview, если он спроектирован, установлен и запущен компетентным инженером, может подойти. Однако я видел, как это было сделано правильно один раз и неправильно чаще, чем я могу вспомнить. Я бы никогда не выбрал его.

BMC Patrol. Просто ужас. Умри, умри!

И, наконец, для журналов и отслеживания проблем вам просто нужно использовать Splunk. Если бы это было около 10 лет назад, я бы сэкономил много потерянного времени.

EventLog Analyzer - это программное обеспечение для мониторинга и управления журналом событий, журналом событий и приложениями, работающее в режиме реального времени без использования агентов. Программное обеспечение анализатора событий собирает, анализирует, создает отчеты и архивы, журнал событий с распределенных хостов Windows, SysLog с распределенных хостов Unix, маршрутизаторы, коммутаторы и другие устройства SysLog, журналы приложений с веб-сервера IIS, FTP-сервер IIS, сервер MS SQL, Сервер базы данных Oracle, DHCP Windows и DHCP Linux серверы. Приложение Eventlog Analyzer генерирует графики и отчеты, которые помогают анализировать системные проблемы с минимальным влиянием на производительность сети.

WhatsUp Gold от Ipswitch

OPManager (Порты, HTTP Get Requests, ICMP, SNMP (Disk/Memory/CPU)) (персональный фаворит!) http://www.manageengine.com/network-monitoring/

OpManager - это отмеченное наградами программное обеспечение для мониторинга сети, которое помогает администраторам находить, отображать, отслеживать и управлять всей ИТ-инфраструктурой.

Cacti (графики SNMP, трафик, использование диска, загрузка процессора и т. Д.) ( http://www.cacti.net/)

О кактусах. Cacti - это комплексное решение для построения сетевых графиков, предназначенное для использования возможностей RRDTool по хранению и графическому отображению данных.

PRTG (Paessler, к сожалению, больше не доступен)

SmokePing: (потеря пакетов и задержка) http://oss.oetiker.ch/smokeping/

Pingdom: http://www.pingdom.com/

Мы используем Ipswitch whatsup gold 12 для мониторинга около 2000 устройств, как производительности, так и мониторов на основе tcp/ip или wmi, а также Windows и Linux. Хорошо, что он прост в использовании и настройке, имеет опции массового изменения и автообнаружения, несколько способов уведомления. Плохая сторона: кажется, что ограничение было около 2000 устройств, после этого производительность снижалась, плюс он работает только на Windows. Распределенная версия на самом деле не заслуживает названия и ценника. Мы оценили nagios (настройка слишком сложна для динамической среды), zenoss (без массовых изменений или автообнаружения, слишком ограничено для динамической среды) и в настоящее время рассматриваем Zabbix, который представляется наиболее перспективным со всеми полезными функциями Whatsup и другими, такими как полностью распределенная архитектура с зондами и сервером, относительно простая настройка, бэкэнд с открытым исходным кодом (mysql, apache)...

Мы только начали использовать "Servers Alive", который очень недорогой, не слишком красивый, но он поддерживает множество различных проверок и может предупреждать несколькими способами, обрабатывать списки технического персонала / списки и т. Д. Для любых уведомлений. Вы также можете делать проверки, полагаясь на других, то есть "эта" система требует, чтобы "что" было запущено / запущено.

Другие вопросы по тегам