Производственные серверы могут внезапно перестать выходить в интернет
проблема
Все производственные серверы внезапно перестали иметь доступ к Интернету, в то время как четыре других сервера, подключенные к той же VLAN и с теми же настройками eth0, могут.
Рисунок 1: System 1
представляет четыре системы, которые могут получить доступ к Интернету, в то время как System 2
указывает на те, которые вдруг не могут с сегодняшнего дня.
Анализ
- Система 1 может получить доступ к Системе 2 и наоборот
Default Gateway
(10.10.10.1) может быть проверен также из Системы 1 и Системы 2- Система 1 может получить доступ к Интернету
- Система 2 не может получить доступ к Интернету
- Ifconfig-х
eth0
конфигурация одинакова для всех производственных серверов - Внутренний DNS-сервер идентичен другим системам, которые могут выходить в интернет
- IP и имена, расположенные в
/etc/resolve.conf
можно получить доступ - Доступ в Интернет можно получить через коммутатор
- Конфигурация всех 8 портов коммутатора на Cisco IOS идентична
- Tracepath от Системы 2 до 8.8.8.8 (DNS Google), Google IP или google.com зависает на
Default Gateway
- Системы, которые не могут получить доступ к системе, похоже, имеют
em1
адаптер вместоeth0
sudo arping -I eth0 ping.tweakers.net
работает на всех 8 системах- Одна из систем, которая не может получить доступ к Интернету, показывает вывод, если
sudo iptables-save
был выполнен - Выход
route -n
идентичен между всеми системами
Tracepath
[username@hostname ~]$ tracepath google.com
1: 10.10.10.10 (10.10.10.10) 0.222ms pmtu 1500
1: 10.10.10.1 (10.10.10.1) 0.662ms
1: 10.10.10.1 (10.10.10.1) 0.601ms
2: no reply
ARP
System1: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on em1
System2: ? (10.10.10.1) at AA:BB:CC:DD:EE:FF [ether] on eth0
Выведите iptables-save на одну из систем, которая не может получить доступ к Интернету.
# Generated by iptables-save vX on Fri Aug 1 10:00:01 2014
*filter
:INPUT ACCEPT [X:Y]
:FORWARD ACCEPT [0:0]
:OUTPUT ACCEPT [X:Y]
COMMIT
# Completed on Fri Aug 1 10:00:01 2014
маршрут -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.10.10.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
X.Y.0.0 0.0.0.0 255.255.0.0 U Z 0 0 eth0
0.0.0.0 10.10.10.1 0.0.0.0 UG 0 0 0 eth0
Неясно, почему доступ к Интернету больше не может осуществляться с четырех производственных серверов. Так как они работают в Production, перезапуск сети должен быть предотвращен. Какие дальнейшие тесты могут быть сделаны, чтобы исследовать проблему?
1 ответ
Проверьте вывод из dmesg Что делает
маршрут -n
сказать?
Каковы выходные данные для интерфейса, указывающего на интернет, из ifconfig?
Можете ли вы пропинговать шлюз по умолчанию?
Также проверьте, нет ли проблем с масками подсети на портах коммутатора, а также на производственных серверах.