Таймауты подключения от Nova_compute к Keystone, RabbitMQ и т. д.
Я работал над развертыванием Openstack (и вне его) в течение последних нескольких месяцев (почти года) и столкнулся с рядом проблем во время развертывания, большинство из которых были либо плохой конфигурацией коммутатора, либо неправильной конфигурацией коммутатора. Конфигурация на тепловых шаблонах.
Мне удавалось несколько раз успешно завершить развертывание Openstack с помощью нового развертывания, однако, когда я готовил Overcloud с проектами, мне не удалось создать экземпляр. Из вывода «списка вычислительных сервисов»:
openstack compute service list
+----+----------------+----------------------+----------+---------+-------+----------------------------+
| ID | Binary | Host | Zone | Status | State | Updated At |
+----+----------------+----------------------+----------+---------+-------+----------------------------+
| 1 | nova-conductor | controller-0.host.cp | internal | enabled | up | 2021-04-20T20:43:03.000000 |
| 2 | nova-scheduler | controller-0.host.cp | internal | enabled | up | 2021-04-20T20:43:01.000000 |
| 12 | nova-compute | compute-0.host.cp | nova | enabled | down | 2021-04-20T09:47:52.000000 |
+----+----------------+----------------------+----------+---------+-------+----------------------------+
Я также заметил, что попытался масштабировать с помощью одного дополнительного узла, но его нет ни в списке выше, ни в «списке гипервизора», но он виден из «списка серверов» узла подоблачного облака:
openstack server list
+--------------------------------------+--------------+--------+-----------------------+----------------+-----------+
| ID | Name | Status | Networks | Image | Flavor |
+--------------------------------------+--------------+--------+-----------------------+----------------+-----------+
| 5cb29129-7ce8-439a-b00b-3868d5a9aa74 | compute-1 | ACTIVE | ctlplane=10.128.0.136 | overcloud-full | baremetal |
| 58c3d587-d2a8-4601-87a7-3fd3d32a78b6 | controller-0 | ACTIVE | ctlplane=10.128.0.5 | overcloud-full | baremetal |
| 288dde8f-5664-42b2-b9f4-333992964dde | compute-0 | ACTIVE | ctlplane=10.128.0.75 | overcloud-full | baremetal |
+--------------------------------------+--------------+--------+-----------------------+----------------+-----------+
Я выполнил две новые установки и теперь столкнулся со следующей проблемой для всех вычислительных служб, которые предназначены для подключения к узлу контроллера:
2021-04-23 22:28:37.891 7 ERROR nova keystoneauth1.exceptions.connection.ConnectFailure: Unable to establish connection to http://10.127.2.8:5000/v3/auth/tokens: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response',))
Ручное скручивание от вычислительного узла до конечной точки трапецеидального искажения дает следующий (ожидаемый) результат:
curl http://10.127.2.8:5000/v3/auth/tokens
{"error":{"code":401,"message":"The request you have made requires authentication.","title":"Unauthorized"}}
Я не верю, что эта проблема вызвана чем-то в сетевом стеке, а чем-то другим. Я был бы признателен за любую помощь в этом.
Информация о развертывании: Узлы контроллера = 1 Вычислительные узлы = 2 развернуты, 4 проверены. ОС = CentOS Steam 8 (как Undercloud, так и Overcloud).
- 4 интерфейса: 1 основной, 2 порта связи (OVS + LACP), 1 порт хранения данных.
- 2 кластера Juniper EX3400 (LACP настроен на связанных портах)
Дайте мне знать, если потребуется дополнительная информация.
РЕДАКТИРОВАТЬ:
Вот дамп TCP из Compute и Controller, описывающий транзакцию вызова keystone: https://pastebin.com/ADT4RCun