Распределенный мониторинг с управлением процессом
Я ищу инструмент для мониторинга моих веб-приложений, которые развернуты на нескольких машинах в одной VPN. Однако, помимо службы мониторинга, я хотел бы управлять своими службами (запуск | останов | перезапуск) из центрального места, преимущественно через веб-интерфейс. Я нашел Монит, и это здорово. Но распространяемая версия ( M / Monit) не является бесплатной. есть какой-нибудь инструмент с открытым исходным кодом с этими возможностями?
3 ответа
M/Monit стоит недорого, а исходный код доступен. Это всего 229 евро для неограниченных хостов. Если у вас есть постоянный доступ к серверам (через VPN или иным способом), это имеет смысл, потому что он делает именно то, что вы просите. Попробуйте оценку и посмотрите, как она работает для вас.
Для распределенного управления процессами я могу порекомендовать MCollective, который является отличным инструментом с открытым исходным кодом для запуска команд на любом количестве систем на основе различных метаданных в реальном времени.
Коллектив Marionette AKA MCollective - это структура для построения систем оркестрации серверов или параллельного выполнения заданий.
В первую очередь мы будем использовать его как средство программного выполнения действий системного администрирования на кластерах серверов. В этом отношении мы работаем в том же пространстве, что и инструменты, такие как Func, Fabric или Capistrano.
Мы постарались немного нестандартно спроектировать эту систему, не полагаясь на центральные инвентаризации и инструменты, такие как SSH, мы не просто причудливый SSH "для цикла". MCollective использует современные инструменты, такие как промежуточное ПО "Публикация и подписка", и современные философии например, обнаружение сетевых ресурсов в реальном времени с использованием метаданных, а не имен хостов. Обеспечение очень масштабируемой и очень быстрой среды параллельного выполнения.
Я не знаю о системе мониторинга, в которую интегрированы эти функции. Может быть, вы могли бы интегрировать его с обработчиками исключений Nagios.
Ну, есть Nagios, и вы можете написать обработчики исключений в Nagios, чтобы иметь дело с неработающими процессами.