Проблема с плоскими файлами Apache на OCFS2 в SAN

У меня есть довольно простой двухузловой кластер Apache с плоскими файлами в сети SAN с использованием файловой системы OCFS2, смонтированной на обоих узлах. Веб-сайт работает, как и ожидалось, но я вижу много следующих сообщений в системных журналах обоих серверов:

На Apache 1

[248816.701082] (apache2,62749,1):ocfs2_mknod:459 ERROR: status = -31
[248816.702187] (apache2,62749,1):ocfs2_mkdir:613 ERROR: status = -31

На Apache2

[249043.856561] (apache2,46225,2):ocfs2_mknod:459 ERROR: status = -31
[249043.858633] (apache2,46225,2):ocfs2_mkdir:613 ERROR: status = -31

Каждый день регистрируется около 6000 таких строк, и ошибка всегда

ocfs2_mknod:459 and ocfs2_mkdir:613.

Кто-нибудь видел это раньше? Я действительно хотел бы избавиться от этих сообщений об ошибках.

2 ответа

Решение

Видимо проблема была из-за плохих секторов (не знаю, как). Спустя несколько дней после того, как я опубликовал этот выпуск, ситуация ухудшилась. Система жаловалась на плохие сектора в разделе, затем монтировалась только для чтения. В конце концов он прекратил монтировать раздел полностью, и нам пришлось создать новый раздел в SAN и восстановить данные из резервной копии.

Новый раздел работал некоторое время, но теперь один из двух узлов, по какой-то причине, раздел монтируется только для чтения. Я получаю следующую ошибку при касании файла:

touch: cannot touch `test_file': No space left on device

На другом узле все работает нормально. Я могу читать и писать как обычно.

Потратив слишком много времени на эту проблему, мы решили, что это не стоит усилий, и сейчас ищем альтернативы - может быть, glusterfs, GFS2 или даже старый добрый общий ресурс NFS для хранения плоских файлов.

У меня была ошибка "Нет свободного места на устройстве", но на моей файловой системе ocfs2 было свободное место с corosync+ стимулятором на suse 11 sp2

 "No space left on device"

Я решил проблему с этим http://www.novell.com/support/kb/doc.php?id=7008696

Другие вопросы по тегам