Монитор для мертвого диска в Linux
У меня проблема с резервными копиями дисков, которые не являются частью RAID или чего-либо подобного (поэтому нет уведомлений от raid-контроллера, если диск умирает). Бывает, что диск полностью умирает, и единственная вещь, которая остается в точке монтирования, недоступна, если вы попытаетесь перейти на него.
Есть ли способ для меня контролировать / получать уведомления, если диск умирает? У меня есть zabbix, и я нашел несколько умных сценариев, которые можно использовать, но я не уверен, что это будет работать, так как не будет /dev/sdb
или же /dev/sda
использовать смарт, когда диск умирает.
Если у кого-нибудь есть какой-нибудь сценарий или идея, я был бы признателен за это.
2 ответа
/var/log/syslog
должен содержать некоторую информацию, связанную с отключением устройства; даже без построения стеков, таких как ELK (ElasticSearch, Logstash, Kibana) для анализа журнала, вы сможете отслеживать такие события с помощью таких инструментов, как sec.
Я написал плагин для nagios, который вы можете адаптировать к Zabbix. Я написал это, когда у нас было несколько серверов Linux, работающих только для чтения из-за случайных ошибок на диске. Это помогло нам выявить проблемы на ранних этапах, и есть код для тестирования-записи файла, но мы отключили его, чтобы проверка могла выполняться как root
,