Каковы подводные камни наличия "несбалансированного" RAID1?
Контекст: у меня есть сервер с двумя накопителями NAS объемом 3 ТБ в RAID1 (Linux dmraid), и я хочу удвоить емкость хранилища, но у меня есть только один свободный отсек для дисков. Я мог бы купить два диска по 6 ТБ, но у меня была мысль, что мне, возможно, удастся купить только один и изменить форму массива так:
- 6 ТБ RAID1
- 6TB диск (новый)
- 6 ТБ RAID0
- 3TB диск (существующий)
- 3TB диск (существующий)
Я не обеспокоен процессом изменения формы, поскольку он должен быть довольно простым:
- Резервное копирование содержимого, конечно.
- Увеличьте существующие RAID1 до 3 устройств, добавив диск 6TB.
- Подождите, пока повторная синхронизация завершится.
- Сбой двух 3TB устройств из массива. (Массив становится ухудшенным.)
- Уменьшите массив до 2 устройств.
- Создайте RAID0 на двух устройствах по 3 ТБ.
- Добавьте RAID0 в качестве второго устройства к RAID1.
- RAID1 повторно синхронизируется и больше не работает.
- Измените размер RAID1, увеличив его с 3 ТБ до 6 ТБ.
Все это должно быть выполнимо онлайн.
Тем не менее, я хочу убедиться, что это нормально. Все диски будут одного производителя и серии (WD Red). Производительность для меня менее важна, чем надежность.
С какими проблемами я могу столкнуться при эксплуатации и обслуживании такого массива? (Я не спрашиваю о процессе миграции / изменения формы; я вполне доволен этой процедурой.)
Будет ли преимущество в производительности или надежности, если устройство RAID1 (диск объемом 6 ТБ или RAID-массив объемом 3 ТБ +3 ТБ) будет помечено как преимущественно для записи? Например, поскольку RAID0 содержит более старые диски, продлит ли запись в основном на устройство RAID0 срок службы этих дисков?
2 ответа
То, что вы делаете, это именно то, что мы делали в нашей (маленькой) компании. Мы увеличили размер нашего массива RAID1 с первоначального 1 ТБ до 4 ТБ аналогично тому, что вы описываете, сначала купив больший диск или два, а затем завершили новый большой массив более крупными дисками, так как некоторые из меньших были удалены из массив из-за сбоя, или потому что они были необходимы для замены других (даже меньших) вышедших из строя дисков на других ПК в компании.
Мы не слишком беспокоимся о производительности, и в те годы мы видели другую производительность, поэтому я не могу об этом говорить.
Мы больше беспокоимся о надежности (как и вы), и я могу вам сказать, что наш RAID-массив представляет собой массив 3-RAID1, плюс внешний запасной элемент, который каждый день повторно синхронизируется и заменяется одним из дисков 3-RAID1. Внешний резерв предназначен для аварийного восстановления: в случае, если какое-либо событие уничтожит все диски в массиве, мы можем немедленно начать с данных предыдущего дня.
При использовании RAID1 с двумя дисками вам нужно беспокоиться о времени повторной синхронизации, которое требуется при установке нового диска для замены вышедшего из строя, который может составлять несколько часов для массива 6 ТБ. Вы останетесь с надежностью одного привода в эти часы. С этими большими дисками, я думаю, лучше иметь как минимум 3-х дисковый RAID1.
tl;dr: убедитесь, что эти малые диски очень надежны.
Вы будете делать то же самое, что и старый метадиск SunOS, с интересными обновлениями, когда диски SCSI стоят слишком дорого.;) Независимо от того, имеют ли диски один и тот же mfgr, влияние ОС практически не влияет. Хорошо стандартизировать одну точную модель, заводское происхождение и версию платы, потому что тогда платы контроллера могут быть заменены в случае выхода платы. (Если у вас есть чистая коробка, как у Луи Россмана, вы можете даже поменять диски между дисками.)
Pf = вероятность отказа
D# = номер диска
Надежность RAID0 составляет Pf(D0) * Pf(D1)
Надежность RAID1 составляет 1 - (1 - Pf(D0)) * (1 - Pf(D1))
Что приводит к общему Pf = 1 - (1 - Pf(D0)) * (1 - Pf(D10)*Pf(D11))
В будущем вы можете найти в блоге BackBlaze конкретные и очень надежные модели дисков, чтобы получить качественные диски за относительно дешевую цену и избежать проблемных дисков. Существуют накопители "для розничных потребителей" с заметно лучшими показателями MTTF/MTBF, чем диски для предприятий, и они также намного дешевле.
Рекомендации
http://www.eventhelix.com/RealtimeMantra/FaultHandling/system_reliability_availability.htm