Прерывистый Windows Server 2008 BSOD и перезагрузка
Наш экземпляр EC2 (Windows Server 2008) несколько раз падал в течение последних 3 месяцев (последний раз был сегодня в 1:05 EST). Изучив файл MEMORY.DMP, мы заметили, что возможной причиной сбоев является rhelnet.sys (RedHat PV NIC Driver).
Серверный Event Viewer имеет следующие записи сразу после сбоя:
Critical - Kernel Power:
The system has rebooted without cleanly shutting down first.
This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.
BugCheck:
The computer has rebooted from a bugcheck. The bugcheck was:
0x000000d1 (0x000000000000002d, 0x0000000000000002, 0x0000000000000000, 0xfffff88001402d14).
A dump was saved in: C:\Windows\MEMORY.DMP. Report Id: 100113-35849-01.
Может ли это быть аппаратной проблемой? Поможет ли это, если мы остановим и запустим экземпляр? Или это более вероятно, что это вызвано программным обеспечением, работающим в системе?
[Обновление 10.01.2013]
Amazon Rep предложила обновить драйверы RH до драйверов Citrix PV в нашем случае:
Обновление фотоэлектрических драйверов
[Обновление 10.08.2013]
Мы выполнили обновление драйверов на клонированном экземпляре. Сразу после обновления мы заметили следующие ошибки в нашей программе просмотра событий:
Xennet6 errors in Event Viewer (Event ID# 5001)
Еще немного покопавшись, я обнаружил, что в этой статье предлагается установить последние версии драйверов Citrix. К сожалению, это совсем не помогло нам, и наша клонированная копия перестала отвечать.
[Обновление 10.08.2013 2]
Я воссоздал экземпляр и снова обновил драйверы PV. После поиска в Интернете я нашел эту статью, где Amazon Rep объясняет, что:
"Event ID 5001 from source Xennet6 cannot be found" message does not
indicate anything wrong, just that the PV driver is looking for a feature
that we have not implemented in our version of Xen.
Некоторое время я буду держать мою тестовую систему, чтобы увидеть, есть ли какие-либо проблемы с ней.
2 ответа
Обновление драйверов, предложенное Amazon Rep, исправило isuse.
В отношении Event ID 5001...
ниже приведен ответ, который я получил от Amazon:
Please ignore the Xennet 5001 error. This error occurs on every instance
that is launched with Citrix PV drivers and is due to the driver looking
for a feature that is not supported on EC2. It will have no other effect on the instance.
У меня та же проблема.
Но AWS Supporter ответит мне так, как показано ниже. Они не уверены, что проблема с приводами Citrix PV
Currently, we are unable to root cause the issue.
In my personal opinion, this might be a one-time only occurrence,
but as you are running Citrix PV Drivers, I highly encourage you to upgrade.
As the Citrix drivers show up in the logs,
they might had been related to the issue.