Изменение размера цифровых океанических капель, использующих CoreOS, нарушает кластер CoreOs

Я новичок в CoreO, и я экспериментировал с ним на DigitalOcean. Позвольте мне вначале сказать, что я не уверен, является ли это проблемой DigitalOcean или CoreOS.


Как тиражировать:

  • Раскрутите 2 CoreOS и свяжите их вместе, чтобы сформировать кластер через Cloud-Config.
  • На приборной панели Digital Ocean отключите обе капли и измените размер.
  • Включите обе капли.
  • SSH в одну из капель
  • запустить список машин Fleetctl

Вы должны получить

2015/04/22 21:05:50 INFO client.go:291: Не удалось получить ответ от http://127.0.0.1:4001/: dial tcp 127.0.0.1:4001: соединение отказано 2015/04/22 21:05: 50 ОШИБКА client.go: 213: Невозможно получить результат для {Get /coreos.com/fleet/machines}, повторная попытка за 100 мс 2015/04/22 21:05:50 INFO client.go:291: Не удалось получить ответ от http://127.0.0.1:4001/: наберите tcp 127.0.0.1:4001: соединение отклонено 2015/04/22 21:05:50 ОШИБКА client.go: 213: Невозможно получить результат для {Get /coreos.com/ fleet / machines}, повторная попытка за 200 мс 2015/04/22 21:05:50 INFO client.go:291: Не удалось получить ответ от http://127.0.0.1:4001/: dial tcp 127.0.0.1:4001: соединение отказано 2015/04/22 21:05:50 ОШИБКА client.go: 213: Невозможно получить результат для {Get /coreos.com/fleet/machines}, повторная попытка через 400 мс 2015/04/22 21:05:51 INFO client.go:291: Не удалось получить ответ от http://127.0.0.1:4001/: dial tcp 127.0.0.1:4001: соединение отклонено 2015/04/22 21:05:51 ОШИБКА client.go: 213: Невозможно получить результат для {Get /coreos.com/fleet/machines}, повторная попытка через 800 мс 2015/04/22 21:05:51 INFO client.go: 291: Не удалось получить ответ от http://127.0.0.1:4001/: dial tcp 127.0.0.1:4001: соединение отказано 2015/04 / 22 21:05:51 ОШИБКА client.go: 213: Невозможно получить результат для {Get /_coreos.com/fleet/machines}, повторная попытка через 1 с 

Выполнение journalctl -u etcd
покажет

22 апреля 14:38:02 тест etcd [578]: [etcd] 22 апреля 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "лидер" на "последователь". 22 апреля 14:38:02 тест etcd [578]: [etcd] 22 апреля 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313: семестр № 7 начался. 22 апреля 14:38:02 тест etcd [578]: [etcd] 22 апреля 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313: лидер изменен с 'f507c71154cc47b1804558c7298d0313' на ''. 22 апреля 14:38:11 test etcd [578]: [etcd] 22 апреля 14:38:11.257 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "подписчик" на "кандидат". 22 апреля 14:38:11 test etcd [578]: [etcd] 22 апреля 14:38:11.258 INFO | f507c71154cc47b1804558c7298d0313: лидер изменен с 'fa61f58c81fd4e7abe9ac0b6585fafef' на ''. 22 апреля 14:38:11 test etcd [578]: [etcd] 22 апреля 14:38:11.546 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "кандидат" на "подписчик". 22 апреля 14:38:11 test etcd [578]: [etcd] 22 апреля 14:38:11.547 INFO | f507c71154cc47b1804558c7298d0313: срок № 9 начался. 22 апреля 14:41:14 тест etcd [578]: [etcd] 22 апреля 14:41:14.847 INFO | f507c71154cc47b1804558c7298d0313: моментальный снимок события 10004 с индексом 10004 завершен 22 апреля 14:53:45 тест etcd [578]: [etcd] 22 апреля 14:53:45.297 INFO | f507c71154cc47b1804558c7298d0313: предупреждение: сердцебиение почти на время ожидания выборов: 359.350151ms 22 апреля 14:55:22 тест etcd [578]: [etcd] 22 апреля 14:55:22.381 INFO | f507c71154cc47b1804558c7298d0313: предупреждение: сердцебиение около времени ожидания выборов: 1.574255587s 22 апреля 15:31:17 тест etcd [578]: [etcd] 22 апреля 15:31:17.551 INFO | f507c71154cc47b1804558c7298d0313: снимок 10001 событий с индексом 20005 завершен 22 апреля 16:19:53 тест etcd [578]: [etcd] 22 апреля 16:19:53.870 ИНФОРМАЦИЯ | f507c71154cc47b1804558c7298d0313: снимок 10007 событий с индексом 30012 завершен 22 апреля 17:08:00 тест etcd [578]: [etcd] 22 апреля 17: 08: 00.254 ИНФОРМАЦИЯ | f507c71154cc47b1804558c7298d0313: снимок 10007 событий по индексу 40019 завершен 22 апреля 17:57:30 тест etcd [578]: [etcd] 22 апреля 17: 57: 30.622 INFO | f507c71154cc47b1804558c7298d0313: снимок 10008 событий по индексу 50027 завершен 22 апреля 18:48:04 тест etcd [578]: [etcd] 22 апреля 18: 48: 04.084 ИНФОРМАЦИЯ | f507c71154cc47b1804558c7298d0313: снимок 10008 событий с индексом 60035 завершен 22 апреля 19:38:37 тест etcd [578]: [etcd] 22 апреля 19: 38: 37.641 ИНФОРМАЦИЯ | f507c71154cc47b1804558c7298d0313: снимок 10007 событий с индексом 70042 завершен 22 апреля 20:07:41 тест etcd [578]: [etcd] 22 апреля 20: 07: 39.493 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "подписчик" на "кандидат". 22 апреля 20:07:44 test etcd [578]: [etcd] 22 апреля 20: 07: 44.282 INFO | f507c71154cc47b1804558c7298d0313: лидер изменен с 'fa61f58c81fd4e7abe9ac0b6585fafef' на ''. 22 апреля 20:07:44 тест etcd [578]: [etcd] 22 апреля 20: 07: 44.895 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "кандидат" на "подписчик". 22 апреля 20:07:44 test etcd [578]: [etcd] 22 апреля 20: 07: 44.899 INFO | f507c71154cc47b1804558c7298d0313: срок 13 начался. 22 апреля 20:09:39 test etcd [578]: [etcd] 22 апреля 20: 09: 39.269 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "подписчик" на "кандидат". 22 апреля 20:09:39 test etcd [578]: [etcd] 22 апреля 20: 09: 39.302 INFO | f507c71154cc47b1804558c7298d0313: лидер изменен с 'fa61f58c81fd4e7abe9ac0b6585fafef' на ''. 22 апреля 20:09:39 test etcd [578]: [etcd] 22 апреля 20: 09: 39.631 INFO | f507c71154cc47b1804558c7298d0313: состояние изменено с "кандидат" на "подписчик". 22 апреля 20:09:39 test etcd [578]: [etcd] 22 апреля 20: 09: 39.632 INFO | f507c71154cc47b1804558c7298d0313: срок 15 начался. 22 апреля 20:11:18 test systemd[1]: остановка etcd... 22 апреля 20:11:18 test systemd[1]: etcd.service: основной процесс завершен, код = завершен, status=2/INVALIDARGUMENT 22 апреля 20:11:18 test systemd[1]: остановлен и т.д. 22 апреля 20:11:18 test systemd[1]: модуль etcd.service перешел в состояние сбоя. 22 апреля, 20:11: тестирование systemd [1]: сбой etcd.service. 

и следующее покажет systemctl cat etcd.service

/usr/lib64/systemd/system/etcd.service
[Единица измерения]
Описание = etcd

[Обслуживание]
Пользователь =etcd
PermissionsStartOnly= верно
Environment=ETCDDATADIR=/ вар / Библиотека / etcd
Окружающая среда =ETCD_NAME=% м
ExecStart=/ USR / бен / etcd
Restart= всегда
RestartSec=10s
LimitNOFILE=40000

Это проблема CoreOS? Практически весь кластер CoreOS сломан. Машины больше не связаны, и я не могу найти способ связать их обратно или как этого избежать. Я не могу найти ничего об этом в Интернете.

1 ответ

Хорошо, после нескольких часов отладки я пришел к выводу, что Digital Ocean не уважает конфигурацию облака, когда вы выключаете каплю, изменяете размер капли и включаете каплю. Мне удалось снова связать экземпляры в кластер, создав другую облачную конфигурацию внутри каждого экземпляра сервера и выполнив следующую команду.
sudo coreos-cloudinit - из файла cloud-config.yml

Другие вопросы по тегам