Получение RAID-контроллера для сканирования поверхности по разумному графику

Контроллер, с которым я сейчас работаю, довольно старый, HP Smart Array P400; отчасти я хочу знать, как обращаться с этим контроллером, но меня также интересует общая точка зрения - если есть другие/более новые контроллеры, которые справляются с этим лучше, как они с этим справляются? В идеале я ищу решения, нейтральные к ОС, но если это не сработает, то будет работать под управлением VMware ESXi.

На этом контроллере есть два основных параметра сканирования поверхности: высокий или режим ожидания с настраиваемой задержкой в ​​секундах.

В течение многих лет он работал на холостом ходу с задержкой в ​​3 секунды. (Не знаю почему, вероятно, это было значение по умолчанию.) Однако недавно я забеспокоился, что это означает, что оно практически никогда не запускает сканирование поверхности, поскольку даже в периоды очень небольшого фактического использования ESXi отправляет «пульсирующие» операции ввода-вывода чаще, чем это, и большинство гостевых ОС также отправляют небольшие сообщения того или иного типа во время простоя.

Поняв, что запретить контроллеру никогда не выполнять сканирование поверхности — плохая идея, я выбрал единственный вариант — «высокий».

Здесь может быть какое-то снижение производительности, но рабочая нагрузка этого массива — это просто системные диски для виртуальных машин, а не диски с данными (для этого я использую ZFS на обычном HBA), поэтому пока никто этого не заметил.

Меня беспокоит то, что теперь приводы не остановятся, и точка. Эта настройка использовалась у меня в течение нескольких дней, и за эти дни было много периодов простоя, так что я полагаю, что контроллер, вероятно, уже мог бы выполнить полное сканирование. Я могу выполнить очистку ZFS для пула в 7 раз большего размера и на дисках с более низкой частотой вращения за меньшее время. Я несколько раз заглядывал на сервер во время простоя и ни разу не видел его без танцующих огней диска, как в музыкальном видео.

Кажется, что сканирование происходит в бесконечном цикле, без каких-либо задержек между сканированиями. Я прав здесь?

Мне это кажется каким-то смешным. Я надеялся, что как только контроллеру удастся пройти сканирование, он остановится хотя бы на несколько дней, прежде чем начать следующее. Я действительно сомневаюсь, что секторы деградируют достаточно быстро, чтобы оправдать постоянное сканирование.

Я беспокоюсь, что это приведет к более быстрому отключению дисков. Это 2,5-дюймовые диски SAS 10 тыс., 300 ГБ и 600 ГБ в RAID 1+0. Является ли это обоснованным беспокойством? Я предполагаю, что этот параметр увеличил общую ежедневную дисковую активность как минимум в десять раз.

Теперь диски постоянно вращаются независимо от доступа, головки фактически не касаются дисков, а привод приводится в движение бесконтактной электромагнитной системой. Поэтому я думаю, что единственная большая разница в износе будет заключаться в подшипнике оси привода при движении диска. В принципе, это звучит довольно незначительно, но на практике оказывается, что многие из них изнашиваются быстрее.

Я предполагаю, что это сканирование обеспечивает последовательный доступ к секторам, что само по себе не потребует множества движений привода. Однако, если сканирование часто прерывается небольшими незанятыми обращениями, требующими, чтобы головки находились где-то в другом месте, это может в худшем случае значительно усилить это движение вперед и назад.

(Возможно, мне следует рассмотреть возможность перехода на твердотельные накопители, но в любом случае я не хочу отключать уже установленные магнитные диски.)

Подводя итог, мои вопросы:

  • Действительно ли он будет сканировать постоянно?

  • Есть ли способ сделать это сканирование периодическим, а не непрерывным? (Если не на этом контроллере, то даже на каком-нибудь другом?)

  • Стоит ли мне беспокоиться по поводу износа дисков?

1 ответ

Я бы не стал использовать эту настройку в течение длительного времени, поскольку это может повлиять на производительность ввода-вывода.

Из руководства HP Smart Array :

Режим сканирования поверхности

Этот параметр определяет режим сканирования поверхности со следующими значениями: Высокий — сканирование поверхности переходит в режим, который гарантированно выполняется независимо от уровня ввода-вывода контроллера.

Другими словами, контроллер не будет отдавать приоритет реальному вводу-выводу по сравнению с сканированием/очисткой. Я предлагаю вам оставить значение по умолчаниюmediumНастройка: если ваше приложение постоянно обращается к дискам, вероятно, ему нужна необходимая производительность.

Если вас беспокоит гниение бита, сканирование поверхности можно время от времени переключать наhigh(т. е. в течение одних выходных каждый месяц), но, как предлагали другие, я бы не стал менять настройку по умолчанию.

Другие вопросы по тегам