Мониторинг резервного копирования NTBackup / Windows Server с помощью пассивных проверок Nagios
Мы наблюдаем за несколькими (на данный момент ~40) серверами, используя Nagios 3, и после нескольких серьезных головных болей, пытающихся проверить журналы событий, текстовые журналы и т. Д. С помощью активных проверок, я установил NSCA на наш сервер Nagios. Следующим шагом, очевидно, будет создание отчета об успешном выполнении программы резервного копирования с использованием send_nsca
и у меня это работает и в Windows (из Nagios Exchange) - BackupExec легко поддерживает запуск команд только после того, как резервная копия была проверена, и нам нужно нечто подобное для NTBackup и Windows Server Backup.
Я очень рад использовать пакетный файл, чтобы сделать это, поскольку NTBackup, кажется, не имеет этой встроенной, но я нашел противоречивую информацию о том, заполняет ли NTBackup %errorcode%
правильно (т.е. только если резервное копирование прошло без ошибок).
У кого-нибудь есть опыт или идеи, как заставить NTBackup правильно сообщить эту информацию, или есть какое-то другое решение, которое мы "должны" использовать?
С Уважением,
деревенщина
5 ответов
Сценарий резервного копирования для нормальной работы. игнорируйте код выхода ntbackup. скраб лог файла для интересных деталей. отправить статус nagios через send_ncsa. прибыль.
следующее из MS technet:
Windows 2000 Backup (Ntbackup.exe) не имеет параметра командной строки, чтобы указать расположение, в которое сохраняются отчеты после завершения операции резервного копирования. Отчет о резервном копировании сохраняется в папке профилей пользователя, который выполнил операцию резервного копирования. Вы можете просмотреть отчеты, щелкнув "Отчет" в меню "Сервис" в резервном хранилище.
Резервное копирование хранит только последние 10 отчетов о резервном копировании. Соответствующие файлы журнала Backup##. Находятся в папке "Documents and Settings\ Имя_пользователя \Local Settings\Application Data\Microsoft\Windows NT\NTbackup\Data".
Я использовал NSClient++ на серверах Windows, чтобы Nagios мог выполнять всевозможные полезные проверки. Я очень рекомендую это, и это может работать для того, что вам нужно.
Например, в одном случае я использовал NSClient++, чтобы проверить и убедиться, что для резервных копий каталога всегда был файл, который был изменен в течение последних 24 часов. Это был хороший, хотя и простой, способ убедиться, что резервное копирование запущено.
Он также имеет функции, которые позволяют вам искать события в журнале событий Windows. Затем Nagios может выдать ошибку на основе результатов. Это может быть в состоянии обеспечить более точную проверку.
Я столкнулся с этой же проблемой. Ненавижу, что у ntbackup нет опций уведомлений. Я просто установил ruby на коробку и скинул этот скрипт. Если вы установите его для запуска после резервного копирования, в пакетном файле или что-то еще, вы всегда должны получить самый последний файл журнала. Я перенес это в mbox на моем сервере nagios, а затем проанализировал дополнительные сценарии.
Вы также можете написать простой сценарий, который просто выполняет регулярное выражение для самого последнего файла журнала, чтобы определить, было ли резервное копирование успешным. ^/NTBackup завершил резервное копирование без ошибок./ Если это не совпадает, вы можете считать это неудачей.
В моем случае я хотел сохранить как можно больше данных, поэтому я просто отправил журнал по электронной почте и проанализировал его.
Я не знаю ответа на ваш вопрос, однако, я мог бы предложить просто попробовать.
Возможно ли настроить сервер на сбой, чтобы выполнить его резервное копирование, а затем проверить значение%errorcode%?
Было бы хорошо, если бы команда могла быть запущена / создана / иметь доступ к резервным копиям журналов данных, где статус резервной копии мог бы быть установлен как:
- Последнее резервное копирование прошло успешно или не удалось?
- Сколько дискового пространства осталось на доступном диске
Только с этим ограниченным объемом информации можно запланировать выполнение системной проверки после того, как резервное копирование должно было завершиться, и состояние резервного копирования Windows 2008 Server может быть определено и передано Nagios.
У кого-нибудь есть идея, где найти данные или как написать программу для их извлечения?