FreeBSD непредвиденное выключение / выключение

В моей цифровой океанической капле произошли непредвиденные остановки в последние дни.

Капелька выключена, и я должен снова включить ее. Если система запросила отключение питания, должна существовать запись в журнале. Но там ничего нет. Журналы сервера показывают нормальный трафик, ничего особенного, а затем отключают систему. С моей точки зрения это выглядит как сбой питания на реальном оборудовании без возможности захвата всего. При панике ядра система должна выполнить перезагрузку, а не отключение питания. Вы я пытаюсь это поведение с sysctl debug.kdb.panic=1

Я написал в службу поддержки, но они отвечают, что мой гость запросил завершение работы, и все в порядке с гипервизором и другими системами, работающими на нем. Поэтому они отказывают в моей просьбе перенести мою каплю на другой гипервизор.

На данный момент у меня нет идеи для дальнейшего расследования.

Система и Услуги:

  • FreeBSD с ZFS
  • PF
  • Nginx
  • uWSGI
  • SSHD
  • Autossh Tunel на другую машину
  • Мунинский узел + мастер

В моих лог-файлах абсолютно ничего нет, и "последняя" доза не показывает запрошенное отключение. Ниже вы найдете последний логлин бевор и после из /var/log/messages

Я надеюсь, у вас есть идеи

Спасибо

-> % last | grep shutdown
shutdown time Tue Dec 5 09:16
monocult pts/1 xxx Tue Dec 5 09:14 - shutdown (00:02)
monocult pts/0 xxx Tue Dec 5 08:36 - shutdown (00:40)
shutdown time Sat Dec 2 13:48
monocult pts/0 xxx Sat Dec 2 13:46 - shutdown (00:01)


Dec 1 21:39:56 application-server sshd[1987]: error: maximum authentication attempts exceeded for invalid user root from xxx port 45166 ssh2 [preauth]
Dec 2 13:46:13 application-server syslogd: kernel boot file is /boot/kernel/kernel

Dec 5 00:42:33 application-server sshd[68482]: error: maximum authentication attempts exceeded for invalid user root from xxx port 52546 ssh2 [preauth]
Dec 5 08:34:26 application-server syslogd: kernel boot file is /boot/kernel/kernel

2 ответа

У меня недостаточно репутации, чтобы комментировать, но я хотел добавить к вашему сообщению, сказав, что у меня точно такой же опыт. Произошло 18 декабря в 10:13 UTC.

Даже после бесчисленного количества писем в службу поддержки, они сообщают, что все хорошо с их стороны, и все же у меня есть капелька, которая выглядит так, как будто сила была извлечена из стены. Ничто в журналах, показывающих завершение работы, не было запрошено ни приборной панелью DO, ни из-под операционной системы. Если это поможет сузить проблему и, возможно, найти общность, я запустил следующее:

  • постфикс
  • голубятня
  • Ezjail
  • пф
  • Nginx (x3)
  • PHP (x2)
  • MYSQL
  • openVPN (x2)
  • Quagga OSPF и Зебра
  • Nagios NRPE (x5)
  • SSHd (x5)

Дроплет также работает под управлением FreeBSD 11.1 x64 с ZFS и 100 ГБ хранилища блоков.

Поддержка говорит, что они ничего не могут сделать, если это не воспроизводимо. Я бы с радостью обменялся с вами деталями, если вы думаете, что объединение наших случаев поддержки поможет DigitalOcean?

Опять же, я знаю, что это не ответ, и я не пытаюсь украсть вашу ветку, просто поддерживаю достоверность вашего опыта.

Проверь диски через smartmontools, 95% проблема там

Другие вопросы по тегам