SUSE box зависает, возможно, из-за проблемы с разделом Reiserfs
У меня есть блок SUSE с 8 ГБ ОЗУ и файловой системой Reiserfs, которая работает без сбоев в течение более 4 лет без проблем, связанных с o / s и h / w. Блок обслуживает несколько (управляемых базой данных) сайтов с низким или умеренным трафиком, что влечет за собой низкое число операций ввода-вывода, использования процессора и памяти.
Недавно машина зависла 3 раза за 10 дней. Это происходило в нерегулярное время (например, не каждый раз в 00:00). Процессор, память и HD сильно используются недостаточно, и я подтвердил, что они также использовались недостаточно во время остановки, поэтому сайты не несут ответственности.
Каждый раз, когда окно зависает, оно может отвечать только на ping, но никакой другой сервис недоступен (ssh, www и т. Д.). Затем я перезагружаю коробку и все возвращается в нормальное состояние (до следующей остановки).
То, что я нашел в /var/log/boot.msg (возможно, происходило до и во время остановки) во всех 3 инцидентах: Filesystem is NOT clean
а затем Replaying journal
которая, кажется, выполняет много работы, но никогда не достигает 100%:
Reiserfs super block in block 16 on 0xfd03 of format 3.6 with standard journal
Blocks (total/free): 786432/540858 by 4096 bytes
Filesystem is NOT clean
Replaying journal: Trans replayed: mountid 39, transid 12424272, desc 7381, len 9, commit 7391, next trans offset 7374
Replaying journal: | | 0.1% 1 trans
Trans replayed: mountid 39, transid 12424273, desc 7392, len 9, commit 7402, next trans offset 7385
Trans replayed: mountid 39, transid 12424274, desc 7403, len 9, commit 7413, next trans offset 7396
Trans replayed: mountid 39, transid 12424275, desc 7414, len 9, commit 7424, next trans offset 7407
Replaying journal: | / 0.5% 4 trans
Trans replayed: mountid 39, transid 12424276, desc 7425, len 8, commit 7434, next trans offset 7417
Trans replayed: mountid 39, transid 12424277, desc 7435, len 9, commit 7445, next trans offset 7428
Trans replayed: mountid 39, transid 12424278, desc 7446, len 9, commit 7456, next trans offset 7439
Replaying journal: | - 1.0% 7 trans
В первом случае эта цифра составила 33%, а в третьем - 58%.
Может ли остановка системы быть связана с reiserfs?
Любые идеи о том, где я должен смотреть дальше?
большое спасибо
1 ответ
Похоже, у вас плохой жесткий диск (или больше). Если во время регулярного использования на диске обнаружен поврежденный сектор... система немедленно пытается восстановить данные и помечает диск как нечистый. Будучи 4-летним или около того, у него вполне могут быть проблемы с диском. На большинство жестких дисков с настольным ПК предоставляется гарантия 1 или 3 года... а на диски серверного уровня обычно предоставляется гарантия 3-5 лет. Возможно, вы захотите запустить утилиту, подобную Sprite GRC, которая выполняет потрясающую работу по поиску проблем и обновлению дисков. (он удивительно хорош в исправлении всех проблем с дисками, которые не являются результатом физического повреждения пластин)