Прерывистый Windows Server 2008 BSOD и перезагрузка

Наш экземпляр EC2 (Windows Server 2008) несколько раз падал в течение последних 3 месяцев (последний раз был сегодня в 1:05 EST). Изучив файл MEMORY.DMP, мы заметили, что возможной причиной сбоев является rhelnet.sys (RedHat PV NIC Driver).

Серверный Event Viewer имеет следующие записи сразу после сбоя:

Critical - Kernel Power:
The system has rebooted without cleanly shutting down first. 
This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.

BugCheck:
The computer has rebooted from a bugcheck.  The bugcheck was:
0x000000d1 (0x000000000000002d, 0x0000000000000002, 0x0000000000000000, 0xfffff88001402d14). 
A dump was saved in: C:\Windows\MEMORY.DMP. Report Id: 100113-35849-01.

Может ли это быть аппаратной проблемой? Поможет ли это, если мы остановим и запустим экземпляр? Или это более вероятно, что это вызвано программным обеспечением, работающим в системе?

[Обновление 10.01.2013]

Amazon Rep предложила обновить драйверы RH до драйверов Citrix PV в нашем случае:

Обновление фотоэлектрических драйверов

[Обновление 10.08.2013]

Мы выполнили обновление драйверов на клонированном экземпляре. Сразу после обновления мы заметили следующие ошибки в нашей программе просмотра событий:

Xennet6 errors in Event Viewer (Event ID# 5001)

Еще немного покопавшись, я обнаружил, что в этой статье предлагается установить последние версии драйверов Citrix. К сожалению, это совсем не помогло нам, и наша клонированная копия перестала отвечать.

[Обновление 10.08.2013 2]

Я воссоздал экземпляр и снова обновил драйверы PV. После поиска в Интернете я нашел эту статью, где Amazon Rep объясняет, что:

"Event ID 5001 from source Xennet6 cannot be found" message does not 
indicate anything wrong, just that the PV driver is looking for a feature
that we have not implemented in our version of Xen. 

Некоторое время я буду держать мою тестовую систему, чтобы увидеть, есть ли какие-либо проблемы с ней.

2 ответа

Решение

Обновление драйверов, предложенное Amazon Rep, исправило isuse.

В отношении Event ID 5001... ниже приведен ответ, который я получил от Amazon:

Please ignore the Xennet 5001 error. This error occurs on every instance
that is launched with Citrix PV drivers and is due to the driver looking
for a feature that is not supported on EC2. It will have no other effect on the instance.

У меня та же проблема.

Но AWS Supporter ответит мне так, как показано ниже. Они не уверены, что проблема с приводами Citrix PV

Currently, we are unable to root cause the issue.
In my personal opinion, this might be a one-time only occurrence,
but as you are running Citrix PV Drivers, I highly encourage you to upgrade.

As the Citrix drivers show up in the logs,
they might had been related to the issue.
Другие вопросы по тегам