Influxdb постоянно перезагружается с момента моей последней перезагрузки

Со времени моей последней перезагрузки каждые 1-2 минуты я вижу следующее:

      Aug 02 13:53:00 monitor systemd[1]: influxdb.service: start operation timed out. Terminating.
Aug 02 13:53:00 monitor systemd[1]: influxdb.service: Failed with result 'timeout'.
Aug 02 13:53:00 monitor systemd[1]: Failed to start InfluxDB is an open-source, distributed, time series database.
Aug 02 13:53:00 monitor systemd[1]: influxdb.service: Scheduled restart job, restart counter is at 4.
Aug 02 13:53:00 monitor systemd[1]: Stopped InfluxDB is an open-source, distributed, time series database.
Aug 02 13:53:00 monitor systemd[1]: Starting InfluxDB is an open-source, distributed, time series database...
Aug 02 13:53:00 monitor influxd-systemd-start.sh[3539]: Merging with configuration at: /etc/influxdb/influxdb.conf

29.07.2021 флюс обновлен с 1.8.6-1 до 1.8.7-1 . ОС — сервер Ubuntu 20.04. При первой перезагрузке после этого начались проблемы.
Первоначально возникла проблема с разрешениями/usr/lib/influxdb/scripts/influxd-systemd-start.sh, что помешало его запуску. Я изменил разрешения на 0755, и все запустилось, но продолжает перезагружаться. Похоже, что он принимает соединения и данные между перезапусками, поскольку telegraf все еще заполняет базу данных, а Grafana может отображать статистику, пока она не совпадает с перезапуском.

я тоже вижу сообщение

      influxd-systemd-start.sh[12171]: [tcp] 2021/08/02 14:21:40 tcp.Mux: Listener at 127.0.0.1:8088 failed failed to accept a connection, closing all listeners

Он прослушивает эти порты

      root@monitor$ ss -ilpn | grep influx
tcp     LISTEN   0        4096                                        127.0.0.1:8088                                              0.0.0.0:*                      users:(("influxd",pid=15115,fd=3))
tcp     LISTEN   0        4096                                                *:8086                                                    *:*                      users:(("influxd",pid=15115,fd=32))

Насколько я знаю, конфигурация не менялась. Нет активных правил брандмауэра.

Кто-нибудь знает, почему он начал плохо себя вести?

1 ответ

Эта ошибка появилась в Influxdb v1.8.7. Проблема на Гитхабе .

Есть множество способов исправить это, и ваше решение — один из них. В нашем случае запуск Influx занял немного больше времени, чем 10-секундное окно, которое позволяет сценарий запуска, поэтому я просто изменил строкуsleep 1в файле/usr/lib/influxdb/scripts/influxd-systemd-start.shкsleep 2чтобы дать Influx больше времени для запуска.

Другие вопросы по тегам