Производственные серверы могут внезапно перестать выходить в интернет

проблема

Все производственные серверы внезапно перестали иметь доступ к Интернету, в то время как четыре других сервера, подключенные к той же VLAN и с теми же настройками eth0, могут.

введите описание изображения здесь

Рисунок 1: System 1 представляет четыре системы, которые могут получить доступ к Интернету, в то время как System 2 указывает на те, которые вдруг не могут с сегодняшнего дня.

Анализ

  • Система 1 может получить доступ к Системе 2 и наоборот
  • Default Gateway (10.10.10.1) может быть проверен также из Системы 1 и Системы 2
  • Система 1 может получить доступ к Интернету
  • Система 2 не может получить доступ к Интернету
  • Ifconfig-х eth0 конфигурация одинакова для всех производственных серверов
  • Внутренний DNS-сервер идентичен другим системам, которые могут выходить в интернет
  • IP и имена, расположенные в /etc/resolve.conf можно получить доступ
  • Доступ в Интернет можно получить через коммутатор
  • Конфигурация всех 8 портов коммутатора на Cisco IOS идентична
  • Tracepath от Системы 2 до 8.8.8.8 (DNS Google), Google IP или google.com зависает на Default Gateway
  • Системы, которые не могут получить доступ к системе, похоже, имеют em1 адаптер вместо eth0
  • sudo arping -I eth0 ping.tweakers.net работает на всех 8 системах
  • Одна из систем, которая не может получить доступ к Интернету, показывает вывод, если sudo iptables-save был выполнен
  • Выход route -n идентичен между всеми системами

Tracepath

[username@hostname ~]$ tracepath google.com
 1:  10.10.10.10 (10.10.10.10)                                  0.222ms pmtu 1500
 1:  10.10.10.1 (10.10.10.1)                                    0.662ms
 1:  10.10.10.1 (10.10.10.1)                                    0.601ms
 2:  no reply

ARP

System1: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on em1

System2: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on eth0

Выведите iptables-save на одну из систем, которая не может получить доступ к Интернету.

# Generated by iptables-save vX on Fri Aug  1 10:00:01 2014
*filter
:INPUT ACCEPT [X:Y]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [X:Y]
COMMIT
# Completed on Fri Aug  1 10:00:01 2014

маршрут -n

Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
10.10.10.0      0.0.0.0         255.255.255.0   U     0      0        0 eth0
X.Y.0.0         0.0.0.0         255.255.0.0     U     Z      0        0 eth0
0.0.0.0         10.10.10.1      0.0.0.0         UG    0      0        0 eth0

Неясно, почему доступ к Интернету больше не может осуществляться с четырех производственных серверов. Так как они работают в Production, перезапуск сети должен быть предотвращен. Какие дальнейшие тесты могут быть сделаны, чтобы исследовать проблему?

1 ответ

Проверьте вывод из dmesg Что делает

маршрут -n

сказать?

Каковы выходные данные для интерфейса, указывающего на интернет, из ifconfig?

Можете ли вы пропинговать шлюз по умолчанию?

Также проверьте, нет ли проблем с масками подсети на портах коммутатора, а также на производственных серверах.

Другие вопросы по тегам