Сбои хоста DELL ESXI - Как определить неисправное оборудование
У меня есть хост ESXI, который несколько раз зависал из-за проблем с оборудованием. Каждый раз в логах я вижу:
A bus fatal error was detected on a component at bus 64 device 2 function 0.
A bus fatal error was detected on a component at slot 4.
На консоли вижу ht tps:https://faultserver.ru/images/056c8cc2b47afebb092ace9869376fe52e6b32b9.jpg
64 в двоичном коде - 40 в шестнадцатеричном. Если я сделаю:
[root@localhost:~] lspci | grep 0000:40:02.0
0000:40:02.0 Bridge: Intel Corporation Xeon E7 v2/Xeon E5 v2/Core i7 PCI
Express Root Port 2a [PCIe RP[0000:40:02.0]]
[root@localhost:~]
При выполнении:
esxcfg-info
и в поисках слота 4 я получаю:
\==+PCI Device :
|----Segment.........................................0x0000
|----Bus.............................................0x40
|----Slot............................................0x02
|----Function........................................0x00
|----Runtime Owner...................................vmkernel
|----Has Configured Owner............................false
|----Configured Owner................................
|----Vendor Id.......................................0x8086
|----Device Id.......................................0x0e04
|----Sub-Vendor Id...................................0x0000
|----Sub-Device Id...................................0x0000
|----Vendor Name.....................................Intel Corporation
|----Device Name.....................................Xeon E7 v2/Xeon E5 v2/Core i7 PCI Express Root Port 2a
|----Device Class....................................1540
|----Device Class Name...............................PCI bridge
|----PIC Line........................................15
|----Old IRQ.........................................255
|----Vector..........................................0
|----PCI Pin.........................................0
|----Spawned Bus.....................................66
|----Flags...........................................12803
\==+BAR Info :
\==+BAR0 :
|----Type......................................0
|----Address...................................0
|----Size......................................0
|----Flags.....................................0
\==+BAR1 :
|----Type......................................0
|----Address...................................0
|----Size......................................0
|----Flags.....................................0
|----Module Id.......................................0
|----Chassis.........................................0
|----Physical Slot...................................4294967295
|----VmKernel Device Name............................PCIe RP[0000:40:02.0]
|----Slot Description................................SLOT 4
|----Passthru Capable................................false
|----Parent Device...................................
|----Dependent Device................................
|----Reset Method....................................5
|----FPT Shareable...................................true
Значит ли это, что процессор идет?
1 ответ
У iDrac нет проблем с HW? Возможно, вам следует запустить полную диагностику на экране загрузки.
Если я правильно помню:
Нажмите F10 при запуске. На левой панели контроллера жизненного цикла щелкните Диагностика оборудования. На правой панели нажмите "Запустить диагностику оборудования". Утилита диагностики запущена.