Паника ядра Oracle Linux 6 - все, что я могу сделать?
Я использую Oracle Linux 6 на сервере HP Proliant. Он работал нормально на прошлой неделе, но раньше казался медленным, поэтому служба Oracle была остановлена. Вместо того, чтобы перезапустить службу, меня попросили перезагрузить сервер, но при запуске мы получили панику ядра
Сначала я получаю следующее, что HP сказал, что это не важно, но я склонен не верить им
[Firmware Bug]: в BIOS повреждены ресурсы hw-PMU (MSR 38d - 330)
ERST: невозможно запросить регион iomem <0xffff88030c1dfe20-0xffff1006183bfc40> для ERST
Тогда Ядро паники
Паника ядра - не синхронизируется: попытка убить init!
Pid: 1, comm: init Не испорчен 2.6.39-300.26.1.el6euk.x86-64 #1
Отслеживание вызовов:
[] паника + 0x91 / 0x1a8
[]? enqueue_entity + 0x52 / 0x210
[] Forgot_original_parent + 0x32b / 0x330
[]? sched_move_task + 0x9d / 0x150
[] exit_notify + 0x1b / 0x190
[] do_exit + 0x1fe / 0x430
[] do_group_exit + 0x55 / 0xd0
[] sys_exit_group + 0x17 / 0x20
[] system_call_fastpath + 0x16 / 0x1b
произошла паника: переключение обратно в текстовую консоль
Может ли кто-нибудь дать мне указание на то, что является или даже может быть причиной этого? Я полностью озадачен на этом этапе. (Системное администрирование не моя ежедневная работа - я могу запустить сервер, но паника ядра находится за пределами моей зоны комфорта)
Изменить: протестировано со следующими ядрами
2.6.39-300.26.1.el6euk.x86_64
2.6.39-200.24.1.el6euk.x86_64
2.6.32-279.19.1.el6.x86_64
2.6.32-279.el6.x86_64
2 ответа
Первое сообщение, которое вы видите во время инициализации: [Firmware Bug]: the BIOS has corrupted hw-PMU resources (MSR 38d is 330)
это не проблема. Это стандартно для систем EL6 и ProLiant. Однако исправление для удаления сообщения доступно здесь.
Что касается сумасшедшей версии ядра Oracle Linux, 2.6.39-300.26.1.el6euk.x86-64, можете ли вы попробовать загрузку с предыдущим ядром в GRUB?
Я думаю, что это должна быть аппаратная проблема, память, процессор или около того. Сначала попробуйте загрузиться с аварийного диска (cd или usb) с помощью memtest и протестируйте его в течение нескольких часов.
Если вы счастливчик, вам нужно только заменить барана, если нет... может быть, вам придется сменить материнскую плату, процессор,...