Кто-нибудь испытывает полную блокировку системы с LUKS?
Я недавно установил пару новых серверов. На этот раз я шифрую большинство моих разделов с помощью dmcrypt+LUKS. Однако эти новые серверы выходят из строя очень часто, каждые несколько дней. Полные блокировки, ядро не отвечает на клавиатуру, система не пингует. Согласно графикам Мунина и записям, использование ресурсов не увеличилось. В локальных журналах системного журнала нет соответствующих записей журнала. На нашем удаленном хосте журналов нет соответствующих записей (на которые новые серверы пересылают системный журнал). Нет соответствующих сообщений netconsole (новые серверы пересылают все сообщения ядра, используя netconsole, на хост журнала). Ядро даже ничего не печатало в TTY. Я попросил хостинговую компанию выполнить полный тест оборудования, и они ничего не нашли. Я подозреваю УДАЧИ. Кто-нибудь еще испытывает полную блокировку с LUKS? Единственная ссылка, которую я смог найти, это http://ubuntuforums.org/showthread.php?t=2125287.
1 ответ
У меня были похожие проблемы при попытке установить систему Arch и Debian на раздел dmcrypt+LUKS. Проблема всегда возникала при безопасном удалении раздела LUKS с помощью dd if=/dev/zero of=/dev/mapper/crypt1
Команда, после перезаписи 6-7 ГБ данных. Оказалось, что неисправен модуль памяти, один из 4х4ГБ.
В пункте 4.3 на странице часто задаваемых вопросов о cryptsetup описывается, как неисправная память может привести к значительному повреждению при записи на зашифрованные устройства, а также к таким связанным с этим симптомам, как зависание и зависания, которые заставляют меня заподозрить неисправную память.
На вашем месте я бы с подозрением отнесся к тому, как эта хостинговая компания проверила свои системы. Скажите им направить вам результаты как минимум одного цикла Memtest86+ и Memtester.
ПРИМЕЧАНИЯ
Просто для справки я перечисляю некоторые из постов / обсуждений, описывающих подобные проблемы, которые я прошел, ища подсказки и решение:
- У этого парня были некоторые блокировки процессора, о которых сообщали сторожевые процессы. Хотя кажется, что его проблема не связана с шифрованием или неисправной памятью, скорее с неисправным вентилятором процессора, это было, когда я начал подозревать проблемы с оборудованием.
- Эти парни, похоже, имеют схожие симптомы, и в последнем предложении в теме упоминается "большой объем оперативной памяти".
- Этот поток (также здесь) описывает проблему мягкой блокировки с версией ядра 2.6.24, давным-давно, для которой тогда был представлен патч. Симптомы кажутся похожими, но основная причина для меня была другой. Этот пост, кажется, описывает ту же проблему тоже.