Идентификатор события 6008: неожиданная перезагрузка
У меня проблема с одним из моих серверов - DELL PowerEdge 2850. Он неожиданно перезагружается, выбрасывая Event Id 6008 в журнал событий ("Неожиданное завершение работы"). Проблема началась вчера и перезагрузилась около 10 раз вчера и продолжала делать это до сегодняшнего дня.
Нет других событий или ошибок, которые регистрируются в журнале событий непосредственно перед событием 6008. Мы ничего не изменили с оборудованием. Единственное, что мы поменяли "программно", это то, что мы включили разработанную нами службу.NET, которая работает на идентичном сервере, который работал без проблем в течение 2 лет. Кроме этого программное обеспечение осталось прежним. Он настроен на создание дампа памяти ядра в случае сбоя сервера, но он этого даже не делает. Я позвонил в техподдержку, и у нас до сих пор нет решения. Я переустановил блоки питания, переключил PDU, на котором включены блоки питания сервера, и выполнил полные тесты DELL Diagnostics (не быстрые тесты), и все прошло. Я предложил технической поддержке, может быть, это источники питания, но сказал "нет", потому что у него два источника питания, и один действует как резервный, поэтому этого не может быть.
Другие примечания, серверы не на USP - что не идеально, но это настройка. У меня в комнате есть два других сервера, которые работают рядом с ним, и ни один из них не сталкивается с такими же проблемами, как этот сервер.
Кто-нибудь сталкивался с подобными проблемами? Любое понимание или предложения будут с благодарностью!
Спасибо!
2 ответа
Отмените последнее, что вы сделали (включив службу.NET), независимо от того, как он работал в прошлом или как он работает на другом сервере.
Это может быть целая куча вещей, вызывающих перезагрузку. Поскольку вы сказали, что включили дамп ядра, но у вас его нет, это может означать, что либо питание немедленно удаляется из системы и не дает ему шансов, либо ядро считает небезопасным записать дамп на диск. В любом случае, это звучит аппаратно, связанные со мной.
Возможно, вы захотите выключить его и переустановить ОЗУ, и, если жесткие диски поддерживают "горячую" замену, просто слегка подтолкните их. Держась за соломинку, но никогда не узнаешь.
Просматривая журнал событий, какие события происходят до выключения - что-нибудь необычное или странно непротиворечивое непосредственно перед отключением? Системный журнал, вероятно, был бы наиболее полезным, но в журнале приложений иногда могут отображаться некоторые интересные вещи.
Я не знаком с серверами Dell, но если они будут чем-то похожими на серверы HP, у них будет своего рода iLO, который может дать вам некоторое представление о сбое оборудования. У меня было что-то похожее - Windows сообщала о неожиданном завершении работы, но встроенные журналы HP сообщали, что жесткий диск умер сразу перед перезагрузкой, и я могу только предположить, что RAID-контроллер выбросил воблер, который Windows не удовлетворил и рухнул.