Журналы vmkernel, заполненные ошибками Heap_Align о сбое lpfc_740
С тех пор, как мы обновили 3.5U5 с 3.5U4, чтобы предположительно решить проблему с ошибочным драйвером Emulex HBA, вызывающим фиолетовые экраны, мы видели это сообщение в /var/log/vmkernel. Это наводнение журналов.
12 января 22:26:00 usbo-qvrt-e11 vmkernel: 0:23:16:34.461 cpu6:1047) ВНИМАНИЕ: Куча: 1522: Ошибка Heap_Align(lpfc_740, 65536/65536 байт, выравнивание 4). вызывающая сторона: 0x90e865 12 января 22:26:00 usbo-qvrt-e11 vmkernel: 0:23:16:34.462 cpu6:1047) ПРЕДУПРЕЖДЕНИЕ: Куча: 1522: Heap_Align(lpfc_740, 65536/65536 байт, 4 выравнивания) не удалось. абонент: 0x90e865 12 января 22:26:00 usbo-qvrt-e11 последнее сообщение повторено 2 раза
Это ESX 3.5U5 build 207095, работающие на HP Proliant DL585 G5 с адаптерами Emulex LPe11002 (по 4 в каждом). У меня есть 2 сервера ESX в этом кластере из-за чрезмерного количества LUN (153) в кластере. Другой хост ESX в этом кластере не видит эти сообщения. Из-за предыдущих проблем с хранилищем глубина очереди LBA HBA была увеличена до 128, а Disk.UseDeviceReset установлен на 0. Из-за большего количества проблем, потенциально связанных с хранилищем, мы увеличили vmklinuxHeapMaxSizeMB до максимально 40 МБ. Это было поднято, когда у нас было похожее сообщение о кучах, но указывало на vmklinux. Я запустил компакт-диск HP Firmware v8.6 (последний). HBA имеют версию 2.82a3 (последняя версия EMC на веб-сайте Emulex). Хранилище - это оптоволоконный канал через нашу EMC Symmetrix. Какие-нибудь мысли? Все это выяснилось у проблемного хозяина фиолетового скрининга несколько недель назад. С тех пор у виртуальных машин возникли всевозможные проблемы с хранилищем, что привело к проверке дисков, синим экранам, отсутствию hal.dll, и этот список можно продолжить.