Ошибка Dmesg в Debian - Что означает этот вывод относительно сбоя в работе eth1?
Рассказ о выходе из NIC;
Я бросил конец вывода dmesg с сервера в pastebin;
Этот сервер (PowerEdge 1850) имеет две сетевые карты, eth0 и eth1. В eth1 определена пара VLAN, которые, в свою очередь, находятся на разных мостах, один мост имеет несколько IP-адресов. eth1 - общедоступный интерфейс. eth0 если для доступа к бэкенду / управлению.
Сервер перешел в автономный режим в том смысле, что перестал обслуживать публичные запросы, и я получил предупреждение. Я подключился через SSH к использованию IP управления на eth0, чтобы найти сервер, нагрузка низкая, много дискового пространства, циклы оперативной памяти и процессора и т. Д. Все службы были запущены и работали, но сервер не обслуживал никаких веб-страниц.
Вот когда я проверил dmesg и увидел вышеприведенный вывод. Кажется, что была проблема с eth1, и он не отправлял пакеты, но принимал их. В выводе dmesg есть несколько сообщений "Сбросить адаптер", поэтому я предполагаю, что сервер "самовосстанавливающийся"?
[10716872.816012] e1000 0000:07:08.0: eth1: Reset adapter
Я побежал tcpdump
чтобы увидеть, что происходит, (выход которого я неуместен!). Однако я мог видеть, что шлюз по умолчанию, который обращен к общедоступным субинтерфейсам VLAN на eth1, выполнял ARP для общедоступных IP-адресов, назначенных серверу, но не отправлял никакого ответа.
Так что, вероятно, поэтому общественные службы не работали. Я перезапустил интерфейс с sudo ifdown eth1 && sudo ifup eth1
который успешно выполнен, но не помог.
Я проверил таблицу ARP;
user@server:~$ arp -n
Address HWtype HWaddress Flags Mask Iface
5.5.5.6 (incomplete) br12
Увидев этот неполный адрес, я сделал снимок в темноте (не ожидая, что он сработает) и добавил MAC для шлюза по умолчанию 5.5.5.6 вручную. Это не сработало.
Это было несколько минут простоя производства, поэтому я перезагружал сервер через несколько секунд, и после его перезагрузки все нормализовалось.
Ниже я разместил содержимое файла /etc/network/interfaces, однако мне нужна помощь в понимании записи pastebin, которую я связал выше. Какова возможная причина для того, чтобы eth1 бросил свою дневную работу в середине рабочего дня?
allow-hotplug eth0
allow-hotplug eth1
allow-hotplug eth1.1
allow-hotplug eth1.2
auto eth0
iface eth0 inet static
address 10.0.1.25
netmask 255.255.255.0
auto eth1
iface eth1 inet manual
auto eth1.2
iface eth1.2 inet manual
vlan_raw_device eth1
auto br12
iface br12 inet static
address 10.0.0.25
netmask 255.255.255.0
bridge_ports eth1.2
bridge_stp off
auto eth1.1
iface eth1.1 inet manual
vlan_raw_device eth1
auto br11
iface br11 inet static
address 5.5.5.5
netmask 255.255.255.248
gateway 5.5.5.6
bridge_ports eth1.118
bridge_stp off
auto br11:0
iface br11:0 inet static
address 5.5.5.4
netmask 255.255.255.248
auto br11:1
iface br11:1 inet static
address 5.5.5.3
netmask 255.255.255.248
В целях отладки;
user@server:~$ uname -a
Linux server.site.com 3.4.10 #1 SMP Thu Sep 13 13:12:24 BST 2012 x86_64 GNU/Linux
user@server:~$ cat /etc/issue
Debian GNU/Linux 6.0 \n \l
Сервер работает 3 дня и 17 часов, ошибок в dmesg/kern.log/message/syslog нет, и он работает нормально. Это lshw
детали для сетевых карт.
1 ответ
Я думаю, что это была ошибка ядра, вероятно, ошибка драйвера или аппаратная ошибка.
Вы можете попытаться найти ошибки в ядре, обновить ядро и так далее.