OEL 7.2 с LACP systemd завершает работу сети перед размонтированием файловых систем _netdev
Я создал кластер NFS с OCFS2 в качестве резервной файловой системы.
Это работает довольно хорошо, за исключением того, что когда узел перезапускается / выключается корректно, это вызывает операцию ограничения, поскольку сеть разрывается перед размонтированием файловых систем OCFS2, чтобы сообщить другому узлу, что он покидает кластер.
Сеть настроена как соединение LACP с двумя физическими адаптерами и двумя интерфейсами VLAN, обеспечивающими возможность подключения по IP. Все это было настроено в nmtui с возможной парой небольших изменений в файлах конфигурации, находящихся в /etc/sysconfig/network-scripts.
Независимо от того, какие зависимости я добавляю (До / После / Требуется и т. Д.), Включая network-online.target и другие, или добавляю в свою собственную службу systemd и скрипт для обработки размонтирования, могу ли я заставить сервер размонтировать файловые системы _netdev OCFS2 через systemd до того, как сеть разрушена.
Я добавил debug.sh в /usr/lib/systemd/system-shutdown для записи некоторых деталей, здесь, где начинается последовательность выключения, "ocfs unmounting device" - это точка, где OCFS2 отключается..
[309.286479] bonding: bond0: Предупреждение: постоянный HWaddr в ens2f1 - 0c:c4:7a:bb:93:3f - все еще используется bond0. Установите HWaddr ens2f1 по другому адресу, чтобы избежать конфликтов. [ 309.286484] bonding: bond0: освобождение активного интерфейса ens2f1 [ 309.288270] ixgbe 0000:02:00.1: удаленный PHC на ens2f1 [309.806098] pps pps0: новый источник PPS ptp0 [ 309.806100] ixgbe 0000:02:00.1: зарегистрированное устройство PHC на ens2f [ 310.028112] IPv6: ADDRCONF(NETDEV_UP): ens2f1: ссылка не готова [ 310.028114] 8021q: добавление VLAN 0 к фильтру HW на устройстве ens2f1 [ 310.028750] bonding: bond0: удаление активного агрегатора [ 310.028754] bonding: bond0: освобождение активного interface ens2f0 [ 310.028755] bonding: bond0: Предупреждение: очистить HW-адрес bond0, пока он все еще имеет VLAN. [ 310.028756] bonding: bond0: при повторном добавлении ведомых устройств убедитесь, что HW-адрес соединения соответствует его VLAN'ам. [310.028773] устройство bond0 вошло в случайный режим [310.028818] устройство ens2f0 вошло в случайный режим [ 310.030895] ixgbe 0000:02:00.0: удален PHC на ens2f0 [310.328057] nfsd: последний сервер вышел, очистив кэш экспорта [310.549842] pps pps1: новый Источник PPS ptp1 [ 310.549844] ixgbe 0000:02:00.0: зарегистрированное устройство PHC на ens2f0 [ 310.772136] IPv6: ADDRCONF(NETDEV_UP): ens2f0: ссылка не готова [ 310.772137] 8021q: добавление VLAN 0 к фильтру HW на устройстве ens2f0 [310.77] ] IPv6: ADDRCONF(NETDEV_UP): bond0.3xxx: ссылка не готова [ 310.774187] IPv6: ADDRCONF(NETDEV_UP): bond0.31xx: ссылка не готова [ 310.775060] IPv6: ADDRCONF(NETDEV_UP): bond0: ссылка не готова [ 310.775560] IPv6: ADDRCONF(NETDEV_UP): bond0.3xxx: ссылка не готова [ 310.779437] IPv6: ADDRCONF(NETDEV_UP): bond0.31xx: ссылка не готова [ 310.832053] IPv6: ADDRCONF(NETDEV_UP): eno2: ссылка не готов [ 310.883931] IPv6: ADDRCONF(NETDEV_UP): eno1: ссылка не готова [312.995508] o2dlm: выходящий домен 78D2C50072B84C8899E6CA71D23E24CC [ 313.010803] ocfs2: Размонтирование устройства (252,3) в (узел 1) [ 313.022493] o2dlm: Выходящий домен 4EBC5792914B4DC0B5C548A94924F48A [ 313.039052] ocfs2: объединяющее устройство 1: 1 030 (копирование), 1-й узел (0312): 1 oc2s2: 1-й узел (2): 1-й узел (1): 0312: копирование, 1-й узел: подключение к узлу 1: 1 (031), копирование, подключение к узлу 1: 1, 0, 2, 0, 0, 1, 2-й, 2-й, 1-й, 2-й узел: 1: 031, 1-й узел: подключение к узлу 1: 1 (0) 282, переименовывающееся в 1: 281, переименовывающееся в 1: 281, 0322, копирующее устройство 1: 023, копирующее устройство 2: 031 (2), переименовывающееся в 1: 023: 1 (2). 0B217FA1ACA5452397F9DA8A8B792DA0 [ 314,122868] ocfs2: Размонтирование устройство (252,4) в (узел 1) [314,231817] ixgbe 0000:02:00.0: удалены PHC на ens2f0 [314,893756] ixgbe 0000:02:00.1: удалены PHC на ens2f1 [315,709225] audit_printk_skb: 321 обратные вызовы подавлены [315.709227] type = 1305 аудит (1476683800.733:156): audit_pid=0 старый = 1053 auid = 4294967295 ses = 4294967295 res = 1 [315.718254] тип = 1130 аудит (1476683800.742:157): pid=1 0 auid=4294967295 ses=4294967295 msg='unit=auditd comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.718271] type=1131 аудит (1476683800.742:158): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=auditd comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.726152] type=1130 аудит (1476683800.750:159): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=systemd-tmpfiles-setup comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.726161] type=1131 аудит (1476683800.750:160): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=systemd-tmpfiles-setup comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.734233] type=1130 аудит (1476683800.758:161): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=rhel-import-state comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.734251] type=1131 аудит (1476683800.758:162): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=rhel-import-state comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.743145] type=1130 аудит (1476683800.767:163): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=rhel-readonly comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.743153] type=1131 аудит (1476683800.767:164): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=rhel-readonly comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.782154] type=1130 аудит (1476683800.806:165): pid=1 uid=0 auid=4294967295 ses=4294967295 msg='unit=lvm2-monitor comm="systemd" exe="/usr/lib/systemd/systemd" hostname=? адр =? терминальные =? res=success' [ 315.954555] systemd-shutdown[1]: Отправка SIGTERM оставшимся процессам... [ 315.958696] systemd-journald[720]: Получен SIGTERM от PID 1 (systemd-shutdow). [ 315.965900] systemd-shutdown[1]: отправка SIGKILL остальным процессам... [ 315.981786] systemd-shutdown[1]: размонтирование файловых систем. [ 316.002080] systemd-shutdown[1]: все файловые системы отключены. [ 316.002083] systemd-shutdown[1]: Деактивация перестановок.
1 ответ
Причиной этого было слишком быстрое завершение remote-fs.target, поскольку сетевой характер OCFS2 потребовал немного больше времени для правильного размонтирования файловой системы, чем фактическое возвращение команды unmount.
Следующим шагом в последовательности завершения работы по отключению сети стало то, что последняя файловая система всегда считалась подключенной к другим узлам, создавая забор.
Мое исправление состояло в том, чтобы создать свой собственный скрипт монтирования / размонтирования и службу systemd с соответствующими задержками в скрипте, с зависимостью от NetworkManager-wait-online.target.