mdadm raid1, сбой диска потерял данные за 14 дней?

Я довольно смущен. Однажды вечером у меня был сервер, который умер. Я пошел, чтобы перезагрузить его и заметил, что он застрял на загрузочном экране "GRUB". Затем я заметил, что жесткий диск вышел из строя. Я вставил новый жесткий диск, загрузился в режиме восстановления и переустановил grub.

Сервер загрузился, затем я попросил mdadm повторно синхронизировать новый диск, и все снова было хорошо.

До тех пор, пока я не заметил, что на накопителе по какой-то причине были данные, которым было 14 дней, 26 апреля. Поэтому мне пришлось восстанавливать более свежую резервную копию, чтобы обновлять сервер. Тем не менее, это беспокоит меня, почему это произошло?

Спасибо

3 ответа

Я думаю, это может произойти, если: у вас есть 2 диска - /dev/sda и / dev / sdb в raid1. Например, запись mbr была на / dev / sda. 26 апреля система посчитала, что / dev / sdb неисправен (по ошибке или из-за сбоя программы) и был удален из рейда. Через две недели / dev / sda провалится, и вы получите не синхронизированный рейд. Как вы сказали выше, вам нужно настроить mdadm, и я предложу настроить smartd (из пакета smartmontools). Смарт "спас мою жизнь" пару раз:)

PS raid1 не является резервной копией, у меня было несколько случаев, когда два диска были повреждены одновременно без какой-либо возможности восстановить какие-либо данные с них.

У вас было зеркалирование RAID1, один из дисков вышел из строя 14 дней назад. Достаточно сильно, чтобы карта перестала писать на нее, но не настолько, чтобы она фактически не работала, когда вы пытались читать / писать. Но поскольку он был помечен как отказавший, ваша карта RAID больше не будет к нему прикасаться. Затем, 14 дней спустя, возможно, в ответ на другую проблему, вы вынули другой (более современный) диск и заменили его на пустой.

Поскольку ваш сбойный диск не был записан в течение двух недель, данным было две недели. Это то, что вы синхронизировали с новым диском, поэтому похоже, что ваш сервер не использовался в течение двух недель.

Предположительно, ваш ДРУГОЙ диск (тот, который не сломался две недели назад) либо

A: все еще хорош и может быть использован для восстановления ваших последних данных, или
B: также не удалось, хотя и в последнее время и, возможно, с большей серьезностью

Отказ одного диска в RAID-1 не является катастрофическим и, следовательно, не вызывает никаких признаков бедствия. Ваш компьютер просто продолжает пихать оставшийся хороший диск. Если вы не будете активно следить за своим RAID-массивом, вы не будете знать о сбое до тех пор, пока не выйдет из строя другой диск, что приведет к сбою сервера (рабочих дисков не осталось).

Некоторые карты RAID сбрасывают флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Это глупо, так бывает.

Это очень похоже на то, что случилось с тобой.

Возможно, ваш /boot не на raid1? только / (или ваши другие разделы).

Некоторые старые версии grub (0.9X I думаю) не могли загрузиться с устройства mdadm.

Если вы можете загрузить liveCD или аналогичный, возможно, вы сможете смонтировать ваш рейд и сохранить данные.

Другие вопросы по тегам