Какой инструмент вы используете для мониторинга ваших серверов?
Более полный список инструментов мониторинга и их функций можно найти на этой странице Википедии.
Как говорится в вопросе, какие инструменты наиболее часто используются для этой задачи и каковы их сильные и слабые стороны?
73 ответа
Nagios в сочетании с nagvis (графика для демонстрации мониторинга)
связаны с почтой, Google Talk и Twitter.. так что вы не можете избежать мониторинга
его даже есть отличный плагин Firefox
Мы попробовали Диспетчер приложений, который работает на Java и MySQL. Это действительно мощный и простой в настройке из браузера. Это не так уж дорого.
В настоящее время мы используем SCOM от MS. Я не рекомендовал бы это никому!
Мы начали использовать мониторинг сервера Bijk.com - http://www.bijk.com/ еще несколько недель назад.
И мы рады простой установке и очень простому графическому интерфейсу и техническому обслуживанию - бесплатные оповещения по почте и SMS полезны для нас.
Мы используем hyperic - у него есть и версия с открытым исходным кодом, и коммерческая.
Он контролирует операционную систему (RHES 3, 4 и 5 + Ubuntu), Apache, MySql, JBoss, Tomcat, почтовые серверы, memcached и, вероятно, может отслеживать больше приложений. Никакой специальной настройки не требуется, все серверы были обнаружены с помощью автоматического обнаружения, даже если они были установлены в нетрадиционном месте. Он очень прост в использовании и настройке, вы можете управлять своими службами (запуск / остановка и т. Д.) И определять оповещения.
Минусы - Вам нужно настроить его для запуска при загрузке (для этого мы используем cron).
Мы используем AlertGrid, он идеально подходит для веб-приложений. В отличие от миллионов типичных мониторов dotcom, он не отслеживает производительность (время отклика и т. Д.) Извне, но позволяет отслеживать выполнение вашего кода и всех ваших пользовательских метрик / статистики, отправляя события изнутри вашего приложения. Как только вы начинаете отправлять события из своего приложения в AlertGrid, все настраивается с помощью приятного визуального редактора (100% веб), и нетехнические люди могут легко создавать свои собственные правила оповещения. Электронная почта, СМС, телефон и интернет-оповещения доступны.
Он имеет плагин для простого мониторинга сервера (windows), который устанавливается как служба, работает в фоновом режиме и генерирует события об использовании процессора, % свободной оперативной памяти и запущенных процессах. Требуется полминуты, чтобы установить, и это работает! Единственное предостережение в том, что машина должна иметь подключение к интернету.
Я использую Sysmon в течение нескольких лет. Есть несколько современных сервисов, которые он не отслеживает, но он легко компилируется на большинстве *nix-платформ, практически не имеет зависимостей, чрезвычайно легок, может легко контролировать очень большое количество устройств и сервисов, может обрабатывать сложные сети макеты (включая кольцевые топологии) и мониторинг отработки отказа. Это в основном соглашение с конфигурационным файлом, но формат довольно прост (основан на plist/css).
Пожалуйста, проверьте Verax NMS. Преимущества:
- Сервис-ориентированный подход
- Серверы мониторинга, а также сети, сетевые устройства (например, коммутаторы, маршрутизаторы), инфраструктура центра обработки данных (например, источник питания, кондиционер) и приложения (например, www и серверы приложений, базы данных)
- Богатая библиотека плагинов и SDK для новых
- Поддержка виртуализации
- Расширенные правила корреляции событий
- Расширенные отчеты (соответствие SLA)
Я работал со многими системами мониторинга во многих местах. Большинство из них уже упоминалось. Вот несколько, которые еще не были:
СМАРТС - теперь принадлежит EMC. На самом деле это лучшая вещь для коренной причины. Это не дешево, и поддержка может перестать быть хорошей, поскольку она принадлежит EMC. Нам посчастливилось поработать с основателями компании, чтобы реализовать ее.
Старший брат. Хорошая и простая, но плохая лицензия. Это также самый уродливый веб-интерфейс, который я когда-либо видел, поэтому мне пришлось его переписать. Никогда не заставлял старшую сестру работать.
HP Openview, если он спроектирован, установлен и запущен компетентным инженером, может подойти. Однако я видел, как это было сделано правильно один раз и неправильно чаще, чем я могу вспомнить. Я бы никогда не выбрал его.
BMC Patrol. Просто ужас. Умри, умри!
И, наконец, для журналов и отслеживания проблем вам просто нужно использовать Splunk. Если бы это было около 10 лет назад, я бы сэкономил много потерянного времени.
EventLog Analyzer - это программное обеспечение для мониторинга и управления журналом событий, журналом событий и приложениями, работающее в режиме реального времени без использования агентов. Программное обеспечение анализатора событий собирает, анализирует, создает отчеты и архивы, журнал событий с распределенных хостов Windows, SysLog с распределенных хостов Unix, маршрутизаторы, коммутаторы и другие устройства SysLog, журналы приложений с веб-сервера IIS, FTP-сервер IIS, сервер MS SQL, Сервер базы данных Oracle, DHCP Windows и DHCP Linux серверы. Приложение Eventlog Analyzer генерирует графики и отчеты, которые помогают анализировать системные проблемы с минимальным влиянием на производительность сети.
OPManager (Порты, HTTP Get Requests, ICMP, SNMP (Disk/Memory/CPU)) (персональный фаворит!) http://www.manageengine.com/network-monitoring/
OpManager - это отмеченное наградами программное обеспечение для мониторинга сети, которое помогает администраторам находить, отображать, отслеживать и управлять всей ИТ-инфраструктурой.
Cacti (графики SNMP, трафик, использование диска, загрузка процессора и т. Д.) ( http://www.cacti.net/)
О кактусах. Cacti - это комплексное решение для построения сетевых графиков, предназначенное для использования возможностей RRDTool по хранению и графическому отображению данных.
PRTG (Paessler, к сожалению, больше не доступен)
SmokePing: (потеря пакетов и задержка) http://oss.oetiker.ch/smokeping/
Pingdom: http://www.pingdom.com/
Мы используем Ipswitch whatsup gold 12 для мониторинга около 2000 устройств, как производительности, так и мониторов на основе tcp/ip или wmi, а также Windows и Linux. Хорошо, что он прост в использовании и настройке, имеет опции массового изменения и автообнаружения, несколько способов уведомления. Плохая сторона: кажется, что ограничение было около 2000 устройств, после этого производительность снижалась, плюс он работает только на Windows. Распределенная версия на самом деле не заслуживает названия и ценника. Мы оценили nagios (настройка слишком сложна для динамической среды), zenoss (без массовых изменений или автообнаружения, слишком ограничено для динамической среды) и в настоящее время рассматриваем Zabbix, который представляется наиболее перспективным со всеми полезными функциями Whatsup и другими, такими как полностью распределенная архитектура с зондами и сервером, относительно простая настройка, бэкэнд с открытым исходным кодом (mysql, apache)...
Мы только начали использовать "Servers Alive", который очень недорогой, не слишком красивый, но он поддерживает множество различных проверок и может предупреждать несколькими способами, обрабатывать списки технического персонала / списки и т. Д. Для любых уведомлений. Вы также можете делать проверки, полагаясь на других, то есть "эта" система требует, чтобы "что" было запущено / запущено.