Время ожидания модуля K8s nodeLocalDns при подключении к coreDns после обновления базовой ОС до карты ubuntu20.04 ConnectX-4
Команда,
У меня есть Mellanox Nic ConnectX-4 на рабочем узле k8s, и на нем размещен модуль DNS nodeLocal. У модуля nodeLocalDns истекает время ожидания при попытке подключения к службе coreDns в кластере k8s.
То же самое работает и на Ubuntu18.
Версии с ошибкой
k8s v1.13.5 Baremetal
Ubuntu 20.04.4 LTS
kernel 5.4.0-100-generic
docker://19.3.13
ниже работает хорошо.
k8s v1.13.5 Baremetal
Ubuntu 18.04.2 LTS
kernel 4.15.0-45-generic
docker://18.9.2
Любой намек, как я могу это отладить? Я не получаю никакой подсказки в журналах.
Ошибки происходят из журналов модулей nodeLocalDNS.
A: dial tcp 100.60.3.4:53: i/o timeout
Где выше находится служба coreDns, и она доступна для проверки связи с модулем nodeLocalDns, но не подключается к порту DNS.
1 ответ
Мы исправили отключение контрольной суммы на сетевом адаптере узла из-за проблемы совместимости. после команды ниже сетевое соединение модуля начало работать. такое было только с melanix ConnectX-4. с ConnectX-5 такого не наблюдалось
ethtool -K ens1 rx on tx off