Dell PERC 5 - RAID-10 продолжает восстанавливать диск 2 каждый день
У меня Dell PowerEdge 2950 с этой картой: контроллер шины RAID [0104]: расширяемый RAID-контроллер Dell PowerEdge 5 [1028:0015] и шесть дисков в RAID-10.
Я заменил диск 2, потому что он не появился, а затем он начал восстанавливать себя:
root@backup01:~# megaraidsas-status
-- Arrays informations --
-- ID | Type | Size | Status
a0d0 | RAID 10 | 5587GiB | DEGRADED
-- Disks informations
-- ID | Model | Status | Warnings
a0e8s0 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s1 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5394
a0e8s2 | ATA ST2000DM001-1E61 1863GiB | rebuild | errs: media:0 other:99
a0e8s3 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s4 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s5 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
Восстановление завершено, виртуальный диск становится оптимальным, и диск 2 переходит в оперативный режим. Затем один раз в день диск 2 действует так, как будто он был удален, и восстановление начинается заново. Как мне сделать это один раз в день перестроить остановить?
Event Description: Removed: PD 02(e1/s2)
Event Description: Removed: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: State change on VD 00/0 from OPTIMAL(3) to DEGRADED(2)
Event Description: VD 00/0 is now DEGRADED1
Event Description: State change on PD 02(e1/s2) from ONLINE(18) to FAILED(11)
Event Description: State change on PD 02(e1/s2) from FAILED(11) to UNCONFIGURED_BAD(1)
Event Description: Background Initialization failed on VD 00/0
Event Description: Inserted: PD 02(e1/s2)
Event Description: Inserted: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: PD 02(e1/s2) is not a certified drive
Event Description: State change on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from UNCONFIGURED_GOOD(0) to OFFLINE(10) from UNCONFIGURED_BAD(1) to UNCONFIGURED_GOOD(0)
Event Description: Rebuild automatically started on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from OFFLINE(10) to REBUILD(14)
1 ответ
Чтобы дать вам предварительный... Мне кажется, что это двойной сбой / прокол данных, что означает, что у вас есть плохие блоки, которые распространены в RAID. Это может вызвать некоторые действительно странные проблемы в моем опыте. Вы можете прочитать об этом здесь: http://www.dell.com/support/Article/us/en/04/438291/en
Есть ли шанс, что мы сможем получить вывод из вашего журнала RAID-контроллера? Установлены ли у вас пакеты администрирования сервера управления Dell? Если нет, то это лучшее место для начала. Похоже, что вы работаете с Linux, вы можете загрузить пакеты OMSA: http://linux.dell.com/repo/hardware/omsa.html.
Если у вас есть открытое управление, вы можете экспортировать журнал RAID-контроллера с помощью этой команды: omconfig storage controller action=exportlog controller=id, где контроллер - это идентификатор вашего контроллера (должно быть 0, если у вас не более одного контроллера RAID). Как только мы получим этот вывод, мы сможем подтвердить, что происходит. (с надеждой).
Только одна последняя вещь, ваш расширяемый RAID 5, вы знаете, это PERC5i, SAS5 или другая модель?
Надеюсь на помощь!