Исходящие http-вызовы терпят неудачу случайным образом – нет маршрута к хосту
Некоторое время назад в нашем кластере Kubernetes возникла странная проблема. У нас есть сеть, содержащая серверы Windows (веб-сервер, почтовый сервер и т. д.) и кластер Kubernetes, на котором работает Rancher v2.6.0.
Кластер взаимодействует с сервером Windows через http-запросы и smtp/imap для отправки и чтения электронных писем. В течение некоторого времени случайные HTTP-запросы завершаются с ошибкой.no route to host
. Похоже, что это ограничивается только соединениями внутри сети и не влияет на запросы к сторонним API. И ошибка возникает не всегда. Многие запросы проходят без проблем, а некоторые терпят неудачу. Я реализовал политику повтора, чтобы повторить тот же запрос через несколько секунд, и иногда это работает при первой повторной попытке, иногда при второй, а иногда и вообще нет.
Я пытался найти решение в Google, но ничего не нашел, тем более что затрагивается только процент всех запросов.
Наш системный администратор, обслуживающий сеть и сервер Windows, не может выявить какие-либо проблемы или даже увидеть запросы. Я предполагаю, что запросы не покидают кластер... если это имеет смысл.
К сожалению, кластер Kubernetes раньше обслуживался коллегой, которого больше нет. Буду очень признателен за подсказки с чего начать поиск решения.
1 ответ
У меня были подобные ошибки, и, похоже, это было связано с ошибками DNS-запросов. Coredns перенаправлял запросы, не относящиеся к Kubernetes, на pfsense DNS, и это произошло случайно, что привело к отсутствию маршрута к хосту. Проверьте журналы Coredns.