sda1 (?) raid провалился на debian - что теперь делать?

ispconfig говорит, что у моего сервера проблемы с рейдом. Сервер не мой, он арендован у хостинговой компании. Установка ОС не была моим делом: хостинговая фирма сделала это.

cat /proc/mdstat 

Personalities : [raid1] 
md0 : active raid1 sda1[2](F) sdb1[1]
      312568576 blocks [2/1] [_U]

Я действительно не знаком с этой проблемой, я никогда не сталкивался с такой проблемой.

Похоже sda1 мертв. Можете ли вы помочь мне, что делать сейчас (кроме этого я должен позвонить в хостинг-фирму)? У меня есть все важные резервные копии.

2 ответа

Решение

Не паникуйте, это распространенная и исправимая ошибка. Ваша хостинговая компания настроила резервный массив из двух дисков для защиты данных в случае отказа одного из дисков. Этот сбой произошел. Выходные данные указывают, что sda1 не удалось, и что массив RAID1 работает, но ухудшен.

Но сейчас вы заняты. Если второй диск выходит из строя, эти данные исчезают, и вам придется восстановить из резервной копии. Попросите вашу хостинговую компанию немедленно заменить неисправный диск и свяжемся с вами, когда это будет сделано!

Кроме того, хорошей идеей является убедиться, что с резервными копиями все в порядке, прежде чем связываться с кем-либо или что кто-то связывается с ухудшенным рейдом. К сожалению, случаются сбои в каскаде, а также ошибки со стороны принимающего персонала (проверьте, чтобы вы и сотрудники хостинговой компании находились на одной странице с тем, что делать с каким диском).

AFAIK, если устройство называется /dev/mdX, это всегда linux softraid, поэтому не задействован ни один аппаратный контроллер хранения, кроме прямого хост-адаптера SATA или SAS.

В Linux есть способы сообщить ему, что диск должен быть логически удален или был добавлен, однако это может понадобиться только в случае горячего подключения напрямую подключенных устройств PATA или параллельных SCSI (что в любом случае следует рассматривать как verboten на оборудовании, которое явно не используется). все равно поддержу).

smartctl (из пакета smartmontools; не запускайте его, если задействован ssd и провайдер не настроил на сервере демон или скрипт cron smartmontools; существуют версии умных утилит, которые могут повредить определенные ssds) Многое о том, ЧТО не так с диском, особенно если он подключен напрямую, как здесь, поэтому можно вызвать dmesg. Значения spinup_count и power_on_hours, которые вы получаете на сменных дисках, которые вы иногда получаете для интересных тем для обсуждения с хостерами;)

Другие вопросы по тегам