Ошибка Dmesg в Debian - Что означает этот вывод относительно сбоя в работе eth1?

Рассказ о выходе из NIC;

Я бросил конец вывода dmesg с сервера в pastebin;

Этот сервер (PowerEdge 1850) имеет две сетевые карты, eth0 и eth1. В eth1 определена пара VLAN, которые, в свою очередь, находятся на разных мостах, один мост имеет несколько IP-адресов. eth1 - общедоступный интерфейс. eth0 если для доступа к бэкенду / управлению.

Сервер перешел в автономный режим в том смысле, что перестал обслуживать публичные запросы, и я получил предупреждение. Я подключился через SSH к использованию IP управления на eth0, чтобы найти сервер, нагрузка низкая, много дискового пространства, циклы оперативной памяти и процессора и т. Д. Все службы были запущены и работали, но сервер не обслуживал никаких веб-страниц.

Вот когда я проверил dmesg и увидел вышеприведенный вывод. Кажется, что была проблема с eth1, и он не отправлял пакеты, но принимал их. В выводе dmesg есть несколько сообщений "Сбросить адаптер", поэтому я предполагаю, что сервер "самовосстанавливающийся"?

[10716872.816012] e1000 0000:07:08.0: eth1: Reset adapter

Я побежал tcpdump чтобы увидеть, что происходит, (выход которого я неуместен!). Однако я мог видеть, что шлюз по умолчанию, который обращен к общедоступным субинтерфейсам VLAN на eth1, выполнял ARP для общедоступных IP-адресов, назначенных серверу, но не отправлял никакого ответа.

Так что, вероятно, поэтому общественные службы не работали. Я перезапустил интерфейс с sudo ifdown eth1 && sudo ifup eth1 который успешно выполнен, но не помог.

Я проверил таблицу ARP;

user@server:~$ arp -n
Address                  HWtype  HWaddress           Flags Mask            Iface
5.5.5.6                  (incomplete)                                      br12

Увидев этот неполный адрес, я сделал снимок в темноте (не ожидая, что он сработает) и добавил MAC для шлюза по умолчанию 5.5.5.6 вручную. Это не сработало.

Это было несколько минут простоя производства, поэтому я перезагружал сервер через несколько секунд, и после его перезагрузки все нормализовалось.

Ниже я разместил содержимое файла /etc/network/interfaces, однако мне нужна помощь в понимании записи pastebin, которую я связал выше. Какова возможная причина для того, чтобы eth1 бросил свою дневную работу в середине рабочего дня?

allow-hotplug eth0 
allow-hotplug eth1 
allow-hotplug eth1.1
allow-hotplug eth1.2

auto eth0
iface eth0 inet static
address 10.0.1.25
netmask 255.255.255.0

auto eth1
iface eth1 inet manual

auto eth1.2
iface eth1.2 inet manual
vlan_raw_device eth1

auto br12
iface br12 inet static
address 10.0.0.25
netmask 255.255.255.0
bridge_ports eth1.2
bridge_stp off

auto eth1.1
iface eth1.1 inet manual
vlan_raw_device eth1

auto br11
iface br11 inet static
address 5.5.5.5
netmask 255.255.255.248
gateway 5.5.5.6
bridge_ports eth1.118
bridge_stp off

auto br11:0
iface br11:0 inet static
address 5.5.5.4
netmask 255.255.255.248

auto br11:1
iface br11:1 inet static
address 5.5.5.3
netmask 255.255.255.248

В целях отладки;

user@server:~$ uname -a
Linux server.site.com 3.4.10 #1 SMP Thu Sep 13 13:12:24 BST 2012 x86_64 GNU/Linux
user@server:~$ cat /etc/issue
Debian GNU/Linux 6.0 \n \l

Сервер работает 3 дня и 17 часов, ошибок в dmesg/kern.log/message/syslog нет, и он работает нормально. Это lshw детали для сетевых карт.

1 ответ

Я думаю, что это была ошибка ядра, вероятно, ошибка драйвера или аппаратная ошибка.

Вы можете попытаться найти ошибки в ядре, обновить ядро ​​и так далее.

Другие вопросы по тегам