RAID-контроллеры энергонезависимого кеша: какая защита от сбоев NVCACHE?

Модель резервного аккумулятора (BBU):

  • Администратор включает кэш обратной записи с BBU
  • записи кэшируются в оперативную память контроллера RAID (основное преимущество в производительности)
  • батарея сохраняет незафиксированные и кэшированные данные в случае потери питания (надежность)

Если я потеряю власть и вернусь через день или около того, мои данные должны быть полными и не поврежденными.

Недостатком этого является то, что, если батарея разряжена или разряжена, ИЛИ ДАЖЕ, ЕСЛИ ЭТО НАХОДИТСЯ В ЦИКЛЕ ОБУЧЕНИЯ (циклы разрядки / зарядки для обеспечения работоспособности батареи), контроллер возвращается в режим сквозной записи, и производительность снижается. Более того, циклы переучивания обычно автоматизируются по расписанию, которое может происходить или не происходить в середине большого трафика. Таким образом, это должно быть вручную отключено и вручную запланировано на нерабочее время, если это вызывает озабоченность. Раздражает в любом случае.

Кэши NV имеют конденсаторы с достаточным зарядом для фиксации любых незафиксированных данных на диск. Мало того, что это более жизнеспособно в более длительных ситуациях потери, но вам не нужно беспокоиться о смерти батареи, износе или повторном обучении.

Все это звучит замечательно для меня. Что мне не нравится, так это перспектива проблемы с флэш-модулем. Что, если он полностью шланг? Что если он только частично из шланга? Немного поврежден по краям? Циклы повторного обучения могут определить, когда выходит из строя простая батарея, но существует ли аналогичный процесс проверки работоспособности вспышки? Я просто гораздо больше доверяю батарее, бородавкам и все такое.

Я знаю, что ОЗУ карты может выйти из строя, сама карта может выйти из строя, хотя это общая территория.

В случае, если вы не догадались, да, я испытал невероятное количество вспышек /SSD/ и т.д. провал:)

2 ответа

Ты слишком обдумываешь это.

Конечно, это немного зависит от конкретной реализации производителя, но, развернув тысячи серверов HP ProLiant за 10 лет, я столкнулся с сотнями сбоев батареи контроллера RAID. Я заменил неисправные блоки, зная, что внезапное отключение питания или сбой системы приведут к некоторому уровню повреждения данных, если у меня не будет исправной батареи.

В последние годы я был рад видеть переход на кэш-память с поддержкой флэш-памяти. Вспышки в системах HP ProLiant представляют собой отдельный суперконденсатор, который подключается к модулю RAM контроллера. Я полагаю, они могут потерпеть неудачу. Я еще не испытал один. RAID-контроллеры HP Smart Array можно настроить так, чтобы кэширование записи было включено независимо от состояния аккумулятора / суперкапы. Это предполагает защиту объекта от внезапной потери питания. Вам все еще нужно беспокоиться о стабильности приложений и сбоях системы.

Похоже, вы имеете в виду контроллеры Dell PERC и их реализацию NVCACHE. Это похожий дизайн. Dell объясняет в своем путеводителе...

4.5.1 Non-Volatile Cache
Dell PERC controllers with non-volatile (NV) cache use the standard battery as contained in the Dell 
PERC controllers with a battery back-up unit (BBU). The difference is in battery implementation:

- The battery in the BBU offering retains the data in cache in the event of a power cycle for a 
guaranteed period of 24 hours (typically up to 72 hours).

- The battery in the NV cache offering will transfer the data from cache to flash in the event of 
a power cycle, where the data will be retained for up to ten years.

Подумайте о вашем приложении и ваших шаблонах доступа к хранилищу. Вы действительно пишете в массив достаточно быстро и с таким объемом данных, который не может быть эффективно записан на диск? Ваше приложение не может восстановиться после сбоя или внезапной перезагрузки?

Если вы действительно обеспокоены доступностью приложений, сфокусируйтесь на защите питания объекта (исправный ИБП + генератор) и укрепите свои системы резервными компонентами (блоками питания, вентиляторами и т. Д.)

Редактировать:

Я смотрю на RAID-контроллер HP Smart Array P410 с встроенным кешем записи. Имеются светодиоды работоспособности для модуля флэш-памяти и более старой внешней батареи (оборудование HP не выполняет цикл переучивания).

Выделенный батарейный микроконтроллер непрерывно контролирует батарейный блок HP Smart Array на наличие признаков повреждения, включая открытый аккумуляторный отсек, частичное короткое замыкание батареи, тайм-ауты зарядки и условия перезарядки.

Для суперконденсатора, его состояние контролируется, но светодиодный индикатор находится на модуле вспышки. RAM исправляет ошибки ECC, так что это еще один уровень защиты. Оба они передаются на хост-сервер через ловушки SNMP и могут просматриваться с помощью диагностических утилит.

Из руководства по технологии HP Smart Array.

Узел Super-cap состоит из двух конденсаторов емкостью 35,7 Фарад 2,7 В, установленных последовательно, обеспечивая 17 Фарад при напряжении до 5,4 В. Зарядное устройство поддерживает Super-cap на уровне 4,8 В, обеспечивая необходимое количество энергии для выполнения операций резервного копирования и продлевая срок службы Super-Cap. Зарядное устройство контролирует состояние Super-cap и активирует светодиодные индикаторы на модуле FBWC, чтобы предупредить о надвигающейся неисправности. Модуль Super-Cap использует тот же форм-фактор и корпус, что и аккумулятор HP 650 мАч серии P, используемый в HP BBWC.

Суть всего этого в том, что производители разработали решения, позволяющие работать с флэш-кешем и стать жизнеспособной заменой старой технологии на основе батарей. В их интересах обеспечить надлежащие средства контроля.

Как примечание, проверьте визуальные индикаторы для флэш-модулей новейшего поколения HP. Вы можете быть уверены, что все эти проверки интегрированы в систему оповещения и диагностики контроллера.

введите описание здесь

Предположительно, сам сервер не сможет загрузиться, если BIOS на контроллере RAID обнаружит сбой во время тестов. Он будет проверять встроенную память так же, как BIOS основного сервера проверяет свою собственную память. Если вам нужны подробности об этом, лучше всего позвонить производителю вашей карты RAID.

Другие вопросы по тегам