Кажется, мой пул ZFS самоуничтожается, есть идеи?
Контекст
Недавно я заметил, что мой freeNAS сообщил мне, что у него проблемы с одним диском. У меня было около 16 сбойных секторов, я прошел смарт-тесты и т. д. Я купил новый диск такой же емкости, пошел его устанавливать, и по какой-то причине адаптер питания для одного из других дисков частично оторвался, поэтому у меня было 4 из 6 дисков в массиве RAID Z2 или вообще без избыточности.
Массив начал обновляться, но так и не завершился и всегда сообщал мне, что было слишком много ошибок (14 тыс.+). Я выяснил эту часть адаптера питания, поскольку маловероятно, чтобы два диска вышли из строя, особенно если второй вышел из строя сразу после открытия корпуса. Я подключил его обратно, и ZFS ничего не смог с ним поделать.
В итоге я заменил старый диск (тот же диск, но ZFS почему-то не смог его распознать, совпал с gpt/smartctl/zpool) на себя, и ZFS вернулась к обновлению серебра.
Конечно, здесь все те же ошибки, теперь я также получаю восстановление состояния третьего диска без всякой причины, я сделал несколько очисток и очисток ZFS, и он все еще выполняет восстановление серебра весь день каждый день, терпит неудачу, я очищаю, восстанавливаю еще немного и это никуда не денется.
Помимо того факта, что я глубоко разочарован неспособностью ZFS оправиться от этой ситуации с относительно низким риском, когда фактически только один диск вышел из строя и был быстро заменен, NAS и его основной и единственный общий ресурс по-прежнему можно использовать, и мне пришлось все равно сделал резервную копию после первого сбоя диска.
Вопрос
Есть ли способ заставить ZFS понять, что с этим пулом все в порядке и что он должен просто восстановить два новых диска (один из которых старый, который я очистил, чтобы помочь ZFS получить возможность его использовать) и перестать мне сообщать об этих ошибках?
Как resilver -force -scrub_later -everything_is_obviously_fine -or_i_couldnt_possible_use_the_share -just_mark_it_all_online -lets_get_back_to_actual_work_now ?
Бродяга
Я немного обеспокоен, потому что сейчас он притворяется, что восстанавливает 3 из 6 дисков в пуле RAIDZ2, в котором явно есть полезные данные, что я серьезно сомневаюсь, что кто-то вообще сможет это сделать.
Я ожидаю, что в ближайшее время он увеличит количество дисков до 4, а может быть, и до всех 6, почему бы и нет, воссоздавая все мои данные из остаточных накоплений магнитной пыли из воздуха, окружающего жесткие диски.
Любое предложение приветствуется. Спасибо!
1 ответ
Я так и не получил ответа, и сначала дела пошли еще хуже, а потом стало лучше. В целом, после как минимум дюжины переустановок, очистки, очистки, удаления файлов, содержащих ошибки, и перезагрузок, он снова оказался в сети.
В целом, я думаю, это в основном означает, что ZFS любит выдавать большие предупреждения, а статус zpool не совсем ясен, поскольку восстановление 3 дисков из 6 в RAIDZ2 было физически невозможно для одного.
Но в основном, пока ваши данные все еще доступны и все выглядит нормально с точки зрения использования общего ресурса, все, вероятно, закончится хорошо, как и здесь, просто продолжайте перезагружаться, очищать, очищать и обрабатывать файлы с ошибками контрольной суммы.