Сбои хоста DELL ESXI - Как определить неисправное оборудование

У меня есть хост ESXI, который несколько раз зависал из-за проблем с оборудованием. Каждый раз в логах я вижу:

A bus fatal error was detected on a component at bus 64 device 2 function 0.
A bus fatal error was detected on a component at slot 4.

На консоли вижу ht tps:https://faultserver.ru/images/056c8cc2b47afebb092ace9869376fe52e6b32b9.jpg

64 в двоичном коде - 40 в шестнадцатеричном. Если я сделаю:

[root@localhost:~] lspci | grep 0000:40:02.0
0000:40:02.0 Bridge: Intel Corporation Xeon E7 v2/Xeon E5 v2/Core i7 PCI 
Express Root Port 2a [PCIe RP[0000:40:02.0]]
[root@localhost:~] 

При выполнении:

esxcfg-info

и в поисках слота 4 я получаю:

        \==+PCI Device : 
           |----Segment.........................................0x0000 
           |----Bus.............................................0x40 
           |----Slot............................................0x02 
           |----Function........................................0x00 
           |----Runtime Owner...................................vmkernel
           |----Has Configured Owner............................false
           |----Configured Owner................................
           |----Vendor Id.......................................0x8086 
           |----Device Id.......................................0x0e04 
           |----Sub-Vendor Id...................................0x0000 
           |----Sub-Device Id...................................0x0000 
           |----Vendor Name.....................................Intel Corporation
           |----Device Name.....................................Xeon E7 v2/Xeon E5 v2/Core i7 PCI Express Root Port 2a
           |----Device Class....................................1540 
           |----Device Class Name...............................PCI bridge
           |----PIC Line........................................15 
           |----Old IRQ.........................................255 
           |----Vector..........................................0 
           |----PCI Pin.........................................0 
           |----Spawned Bus.....................................66 
           |----Flags...........................................12803 
           \==+BAR Info : 
              \==+BAR0 : 
                 |----Type......................................0 
                 |----Address...................................0 
                 |----Size......................................0 
                 |----Flags.....................................0 
              \==+BAR1 : 
                 |----Type......................................0 
                 |----Address...................................0 
                 |----Size......................................0 
                 |----Flags.....................................0 
           |----Module Id.......................................0 
           |----Chassis.........................................0 
           |----Physical Slot...................................4294967295 
           |----VmKernel Device Name............................PCIe RP[0000:40:02.0]
           |----Slot Description................................SLOT 4
           |----Passthru Capable................................false
           |----Parent Device...................................
           |----Dependent Device................................
           |----Reset Method....................................5
           |----FPT Shareable...................................true

Значит ли это, что процессор идет?

1 ответ

У iDrac нет проблем с HW? Возможно, вам следует запустить полную диагностику на экране загрузки.

Если я правильно помню:

Нажмите F10 при запуске. На левой панели контроллера жизненного цикла щелкните Диагностика оборудования. На правой панели нажмите "Запустить диагностику оборудования". Утилита диагностики запущена.

Другие вопросы по тегам