Есть ли способ прочитать атрибуты SMART для дисков в сети хранения данных?
Мы работаем с массивом SSD в сети SAN, и производительность отличная. Но нам нужно отслеживать атрибуты SMART на выносливость при записи, чтобы мы могли определить, когда накопители близки к износу. Мы протестировали эти диски и подтвердили, что можем получить эти данные, но не пытались их использовать в SAN. Теперь мы обнаружили, что наша сеть SAN (Dell PowerVault) не имеет возможности запрашивать данные SMART. Все, что он делает, это запрашивает несколько атрибутов и генерирует отчет. Этот отчет не содержит атрибутов, которые нам нужны.
Есть ли способ получить доступ к данным SMART наших дисков, не вынимая их из массива и не помещая их в другую машину для чтения данных?
4 ответа
MD3620f не предоставляет эту информацию через Диспетчер хранилища модульных дисков, SMcli, и даже не включает данные SMART ни в один из файлов комплекта поддержки.
Ваша единственная надежда на получение SMART-данных без извлечения дисков будет связана с опросом SNMP, так как это имеет тенденцию собирать любые данные, которые могут быть извлечены из каждого компонента в корпусе. Если SNMP не предоставляет вам данные, то микропрограмма контроллера, скорее всего, даже не извлекает данные SMART с дисков SATA.
Источник: непосредственный опыт работы старшим инженером по поддержке массивов серии MD3 для Dell
Изменить: ewwhite также делает отличное замечание - нет реальной необходимости активно контролировать SSD в этом массиве, если вы не будете продолжать использовать его после истечения срока его службы или без гарантийного покрытия (в этом случае эти данные по крайней мере быть "удобным"). Если вы используете SSD для кеширования, вам не о чем беспокоиться. Отказ твердотельного накопителя может незначительно повлиять на производительность, но после гарантийной замены все по-новому. Если вы используете SSD как часть группы дисков (не используя более новые функции кэширования SSD или пула дисков), тогда рассмотрите возможность использования RAID6, чтобы не иметь высокого риска для беспокойства.
Вообще говоря, это управляется прошивкой вашего хранилища. Это также не ваша проблема, потому что если SSD выходит из строя, он будет заменен поставщиком независимо от того, как вы его используете.
Я согласен с мнением о том, чтобы позволить массиву хранения справиться с этим. Есть так много заблуждений о том, как поддерживать и управлять хранилищем SSD...
Относитесь к ним как к дискам в этом случае.
- RAID их.
- Есть запчасти.
- Держите ваш контракт поддержки активным.
- Прибыль.
Нет необходимости предварительно заменять твердотельные накопители. Если у вас действительно большая нагрузка при записи, вам также следует использовать твердотельные накопители, оптимизированные для этой рабочей нагрузки. Они существуют!
Пример того, что корпоративный SAS SSD может сообщить через контроллер RAID или SAN:
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Data Drive
Interface Type: Solid State SAS
Size: 400 GB
Firmware Revision: HPD9
Serial Number: 00197356
Model: HP MO0400FBRWC
Current Temperature (C): 29
Maximum Temperature (C): 43
Usage remaining: 99.51%
Power On Hours: 11672
Estimated Life Remaining based on workload to date: 98765 days
SSD Smart Trip Wearout: False
PHY Count: 2
PHY Transfer Rate: 6.0Gbps, Unknown
Тебе не повезло, что ты обратился к ним напрямую. Ваше устройство SAN должно каким-то образом обслуживать эти данные (SNMP или какой-то собственный интерфейс мониторинга).