Мониторинг резервного копирования NTBackup / Windows Server с помощью пассивных проверок Nagios

Мы наблюдаем за несколькими (на данный момент ~40) серверами, используя Nagios 3, и после нескольких серьезных головных болей, пытающихся проверить журналы событий, текстовые журналы и т. Д. С помощью активных проверок, я установил NSCA на наш сервер Nagios. Следующим шагом, очевидно, будет создание отчета об успешном выполнении программы резервного копирования с использованием send_nscaи у меня это работает и в Windows (из Nagios Exchange) - BackupExec легко поддерживает запуск команд только после того, как резервная копия была проверена, и нам нужно нечто подобное для NTBackup и Windows Server Backup.

Я очень рад использовать пакетный файл, чтобы сделать это, поскольку NTBackup, кажется, не имеет этой встроенной, но я нашел противоречивую информацию о том, заполняет ли NTBackup %errorcode% правильно (т.е. только если резервное копирование прошло без ошибок).

У кого-нибудь есть опыт или идеи, как заставить NTBackup правильно сообщить эту информацию, или есть какое-то другое решение, которое мы "должны" использовать?

С Уважением,

деревенщина

5 ответов

Решение

Сценарий резервного копирования для нормальной работы. игнорируйте код выхода ntbackup. скраб лог файла для интересных деталей. отправить статус nagios через send_ncsa. прибыль.

следующее из MS technet:

Windows 2000 Backup (Ntbackup.exe) не имеет параметра командной строки, чтобы указать расположение, в которое сохраняются отчеты после завершения операции резервного копирования. Отчет о резервном копировании сохраняется в папке профилей пользователя, который выполнил операцию резервного копирования. Вы можете просмотреть отчеты, щелкнув "Отчет" в меню "Сервис" в резервном хранилище.

Резервное копирование хранит только последние 10 отчетов о резервном копировании. Соответствующие файлы журнала Backup##. Находятся в папке "Documents and Settings\ Имя_пользователя \Local Settings\Application Data\Microsoft\Windows NT\NTbackup\Data".

Я использовал NSClient++ на серверах Windows, чтобы Nagios мог выполнять всевозможные полезные проверки. Я очень рекомендую это, и это может работать для того, что вам нужно.

Например, в одном случае я использовал NSClient++, чтобы проверить и убедиться, что для резервных копий каталога всегда был файл, который был изменен в течение последних 24 часов. Это был хороший, хотя и простой, способ убедиться, что резервное копирование запущено.

Он также имеет функции, которые позволяют вам искать события в журнале событий Windows. Затем Nagios может выдать ошибку на основе результатов. Это может быть в состоянии обеспечить более точную проверку.

Я столкнулся с этой же проблемой. Ненавижу, что у ntbackup нет опций уведомлений. Я просто установил ruby ​​на коробку и скинул этот скрипт. Если вы установите его для запуска после резервного копирования, в пакетном файле или что-то еще, вы всегда должны получить самый последний файл журнала. Я перенес это в mbox на моем сервере nagios, а затем проанализировал дополнительные сценарии.

Вы также можете написать простой сценарий, который просто выполняет регулярное выражение для самого последнего файла журнала, чтобы определить, было ли резервное копирование успешным. ^/NTBackup завершил резервное копирование без ошибок./ Если это не совпадает, вы можете считать это неудачей.

В моем случае я хотел сохранить как можно больше данных, поэтому я просто отправил журнал по электронной почте и проанализировал его.

http://pastie.org/1510940

Я не знаю ответа на ваш вопрос, однако, я мог бы предложить просто попробовать.

Возможно ли настроить сервер на сбой, чтобы выполнить его резервное копирование, а затем проверить значение%errorcode%?

Было бы хорошо, если бы команда могла быть запущена / создана / иметь доступ к резервным копиям журналов данных, где статус резервной копии мог бы быть установлен как:

  • Последнее резервное копирование прошло успешно или не удалось?
  • Сколько дискового пространства осталось на доступном диске

Только с этим ограниченным объемом информации можно запланировать выполнение системной проверки после того, как резервное копирование должно было завершиться, и состояние резервного копирования Windows 2008 Server может быть определено и передано Nagios.

У кого-нибудь есть идея, где найти данные или как написать программу для их извлечения?

Другие вопросы по тегам