Измерение износа SSD за контроллером LSI MegaRAID?

Я пытаюсь выяснить, как измерить общее количество записанных байтов (или процент от максимального ожидаемого, либо это нормально) для нескольких массивов RAID за контроллерами LSI. Все контроллеры являются контроллерами LSI MegaRAID SAS 9271-8i. Я пытался использовать MegaRAID Storage Manager и MegaCLI, но ни одна из них не показывает нужную мне информацию. В сети я нашел пару решений, но, похоже, они предназначены только для Linux, где вы можете исправить ядро ​​или использовать smartctl нестандартными способами. Это не будет работать для меня в Windows.

Я бы очень хотел избежать вытаскивания дисков, установки их на другую машину, тестирования с помощью SMART, а затем их установки обратно. Была бы настоящая боль в шее. Если это важно, каждый контроллер имеет две группы виртуальных дисков по 4 диска в RAID10, причем SAS SSD образуют группы.

3 ответа

Я бы не стал смотреть на износ SSD за аппаратным RAID-контроллером. Вы используете RAID по определенной причине, поэтому позвольте контроллеру справиться с этим.

Это бонус, который вы используете на корпоративных дисках SAS. Если твердотельные накопители хорошо сочетаются с рабочей нагрузкой (интенсивная запись / оптимизация чтения / и т. Д.), Не нужно углубляться в глубины.

В этом случае ваш контроллер LSI 9271 имеет технологию SSD Guard™ (запускаемую нужными вам цифрами SMART), которая может использовать твердотельный накопитель с горячим резервом, если вас беспокоит быстрый износ или некоторые преждевременные неисправности.

Я использую megacli а также smartctl в Ubuntu Linux.

Сначала получите Device Id одного из дисков SSD:

megacli -pdlist -aALL -NoLog | egrep '(Raw Size|Inquiry Data|Device Id)'

Например, идентификатор устройства 5, Затем вы выполняете:

smartctl -x -d megaraid,5  /dev/sda

Здесь показан подробный отчет SMART для SSD-накопителя, подключенного к контроллеру Broadcom / Avago / LSI MegaRAID.

В CentOS я, конечно же, отслеживаю твердотельные накопители с помощью smartctl, для чтения в основном случайных архивов я использую стек Dell gen 12, 13 и 14 с не-Dell Samsung EVO 840, 850 и 860. Не выбирайте Samsung PRO, хотя и дороже, они случайным образом колеблются для довольно много людей, как сообщается на форумах Dell и разрушают весь объем. EVO продержался у нас 3 года и даже RAID 5 все же выжил. ~3 внезапно умерли от растущей ~66 дисков.

В CentOS каждые x часов я работаю в цикле от 0 до 23 для RAID-массива PERC на основе LSI Dell R720/730/740xd через скрипт Python и SSH и сравниваю отклонения важных значений с помощью команды, как показано ниже + пользовательский анализатор этого вывода и БД для хранения даты + значения для отслеживания отклонений:

smartctl -a -d sat+megaraid,0 /dev/sda

Я считаю важным следить за тем, не приближаюсь ли я к гарантированным терабайтам Samsungs, записанным через "241 Total_LBAs_Written", как если бы пользователи злоупотребляли лимитом записи, они все могли внезапно начать умирать, а RAID не помогал, а также перераспределения, которые могут подскажите, что вам скоро понадобится запасной.

Другие вопросы по тегам