Может ли nagios показать мне историю значений, сообщенных для службы / хоста?
У меня есть nagios, работающий с nrpe, но я относительно новичок в его настройке.
Есть ли способ получить необработанные числа для чеков, вместо того, чтобы просто ок / не ок?
Например, если я хочу контролировать использование памяти хостом в течение процесса, который выполняется в течение нескольких часов, и посмотреть, как он меняется, то может ли это сделать nagios или он только скажет мне, если он отключит какой-то порог?
6 ответов
Я считаю, что вы ищете RRDtool для сбора данных для вас. Я использую check_mk, который представляет собой набор расширений для Nagios, но есть множество других вариантов.
Как говорят другие, Nagios, по сути, является системой оповещения, т. Е. Нет встроенной системы исторической отчетности.
Однако есть много дополнений, которые сделают эту работу за вас. Я считаю NagiosGraph наиболее распространенным, достаточно простым в установке и использовании.
Вы можете иметь ежедневные, еженедельные, ежемесячные и годовые просмотры вашей метрики, а также можете создавать свои собственные графики для своих плагинов, манипулируя отображением метрики (файл карты nagiosgraph).
Так сказать, "из коробки" ничего не делает с реальными возвращаемыми данными; Вы используете надстройку, которая подключается к Nagios для обработки данных. Одним из наиболее популярных дополнений для отображения этих perfdata является pnp4nagios. Он хорошо интегрируется с веб-интерфейсом, прост в настройке и поставляется в нескольких дистрибутивах Linux.
Другие варианты см. В категории надстроек для графиков / трендов в Nagios Exchange.
Nagios лучше всего подходит для мониторинга сервисов, чтобы вы могли получать уведомления, если сервис / ящик не работает. Я бы предложил munin для отображения системных ресурсов, munin также имеет функцию оповещения, если значение ресурса превышает пороговое значение. Я использую munin (как дополнительный инструмент мониторинга) с Amazon SNS для получения предупреждений.
Существуют различные надстройки RRD (специальный тип базы данных для сбора данных такого времени) для nagios.
Однако nagios - плохой выбор для такого мониторинга производительности. Он действительно лучше всего работает в качестве системы оповещения, и большинство сайтов используют что-то еще, например ганглии или кактусы, для постоянного отслеживания производительности.
Нагиос - дымовая сигнализация, ганглии - термометр.
В каждой проверке есть третье поле, в которое вы можете поместить любые данные, которые вам нужны, но для этого необходимо выполнить поиск в файле nagios.log.
Как правило, nagios уведомляет вас о хорошо / не хорошо. Я думаю, можно с уверенностью сказать, что большинство людей используют нагио, чтобы сообщить им, происходит ли что-то странное в их среде. Он отображает числа для текущего состояния, но это не похоже на то, что вы просите.
Я вытащил значения из nagios.log раньше. Это не красиво, но выполнимо, и если это один выстрел, то это может быть вашим лучшим выбором. (Пример: меня однажды попросили вытащить историю Exchange, которая потребляла все свое хранилище в течение определенного периода времени.)
Если вы вместо этого ищете nagios, чтобы постоянно проверять флуктуации, вы можете написать какой-то собственный скрипт для запуска npre, который определяет нормально / не хорошо как "слишком сильные колебания".
Надеюсь, это поможет.