Рейд 5 Процесс восстановления

Я только недавно установил 3-х дисковый массив MDRAID 5 емкостью 4 ТБ для зеркалирования и оперативного резервного копирования нашего сервера.

Я готовлюсь к будущему аппаратному (дисковому) отказу и хотел смягчить ошибку восстановления из URE.

Обычно я думаю, что процесс перестройки массива:

  1. Снимите и замените неисправный диск.
  2. Перестроить массив

Насколько я понимаю, в устаревшем массиве RAID 5 вы все еще можете получить доступ к данным; но когда неисправный диск был заменен, а массив перестраивается, при обнаружении URE восстановление завершится неудачно, и данные в массиве будут немедленно оказаны нечитаемыми и невосстановимыми.

Если мое понимание верно, то не представляется разумным восстанавливать массив, пока все (читаемые) данные не будут дублированы.

Это оставляет меня с процессом:

  1. Повторяющиеся данные из массива.
  2. Снимите и замените неисправный диск.
  3. Перестроить массив

Есть ли другой процесс, который уменьшил бы сбои восстановления (кроме отказа второго диска во время восстановления)? Безопасно ли перестраивать массив без дублирования данных? Являются ли мои предположения неверными, например, при повторной сборке на URE, но данные все еще доступны в ухудшенном состоянии?

2 ответа

Решение

Я понимаю, что URE немного сложнее и неизвестны большинству, так как они связаны с отказами массивов.

Вывод: URE могут вызывать сбои массивов, но не так часто, как говорится в статьях. Но RAID 5 по-прежнему является очень подверженным сбоям RAID-массивом по сравнению со ВСЕМИ другими уровнями RAID.

Итак, вернемся к основам, что мы предпринимаем для восстановления RAID 5? Мы пытаемся восстановить паритет до того, как выйдет из строя второй диск. Вот и все! Это любое необходимое средство.

Это приводит меня к укреплению моего списка

  1. Временно дублируйте данные из массива, лента является самой дешевой, если массив большой и пространство на жестком диске недоступно.
  2. Снимите и замените неисправный диск.
  3. Создайте новый массив с новым диском с нуля.
  4. Перезагрузите файлы в новый массив с шага 1.

Это предполагает, что массив можно отключить, что не всегда так. В конце концов, однако, некоторые нашли то же самое, что создание нового массива с нуля и передача данных одним махом проще и быстрее, чем попытка полной перестройки большого массива с множеством ТБ.

Кроме того, я подозреваю, что чтение данных и последовательная запись данных из массива в ухудшенном состоянии только один раз значительно снизят вероятность отказа второго диска до того, как данные будут продублированы, по сравнению с полным перестроением, хотя вероятность все еще остается. там.

В конце концов, все дело в управлении рисками, которое зависит от множества конкретных обстоятельств. В моем конкретном случае я обычно могу найти время в 24-часовом интервале для восстановления моего массива, и, таким образом, в моем случае лучше всего было бы выполнить резервное копирование, восстановление и восстановление из новой резервной копии.

Вы можете подготовить себя к выходу из строя диска и ко всем остальным неприятностям, реализовав план резервного копирования 3-2-1, мое личное мнение 3-2-1 должно быть в каждой критически важной бизнес-среде.

Следование правилу 3-2-1 облегчит жизнь, очевидно, это будет стоить $, но результат должен стоить того.

Вы можете узнать больше здесь: https://knowledgebase.starwindsoftware.com/explanation/the-3-2-1-backup-rule/

https://www.veeam.com/blog/the-3-2-1-0-rule-to-high-availability.html

Другие вопросы по тегам