Кто убивает мой докер контейнер?
Mesos → Выполненные задачи в песочнице. В файле stdout я вижу сигнал killTask:
Received killTask for task sources.b4e2c8e6-5b42-11e7-aec0-024227901b13
Полная привязка стандартного файла выглядит следующим образом. Вы можете увидеть даже после получения killTask
сигнал мой процесс все еще работает. то есть мой процесс не заканчивается сам.
2017-06-27 14: 16: 08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:16:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:16:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:16:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:16:48,337 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:16:58,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:08,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:38,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт 2017-06-27 14:17:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:08,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:38,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:18:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:18,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:19:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:20:08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:20:18,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:20:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:20:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт 2017-06-27 14:20:48,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт Получено killTask для источников задач.b4e2c8e6-5b42-11e7-aec0-024227901b13 2017-06-27 14:20:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
Полный снимок файла stderr выглядит следующим образом:
I0627 19: 42: 51.959991 7613 fetcher.cpp: 533] Информация о сборщике: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0"," элементы ":[{" действие ":"BYPASS_CACHE" "URI":{"кэш": ложь, "исполняемый": ложные, "экстракт": истинные, "значение":" файл:\/\/\/ и т.д. \/docker.tar.gz"}}],"sandbox_directory":"\/ вар \ / Lib\/ Mesos \ / рабы \/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0\/ рамки \/0e528b66-37aa-4d7a-933e-4638aabf494a-0000\/ исполнители \/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13\/ пробеги \/219c102b-28ae-41d5-b98f-11829315119e"} I0627 19:42:51.963241 7613 fetcher.cpp:444] Извлечение URI-файла:///etc/docker.tar.gz' I0627 19:42:51.963279 7613 fetcher.cpp:285] Загрузка непосредственно в каталог песочницы I0627 19:42:51.963295 7613 fetcher.cpp:222] Извлечение URI-файла:///etc/docker.tar.gz' I0627 19:42:51.964923 7613 fetcher.cpp:207] Скопированный ресурс '/etc/docker.tar.gz' в /var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/ исполнители / sources.b4e2c8e6-5b42-11e7-aec0-024227901b13 / работает / 219c102b-28ae-41d5-b98f-11829315119e / docker.tar.gz" I0627 19: 42: 52.070482 7613 fetcher.cpp: 123] Извлечено '/var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/ frameworks / 0e528b66-37aa-4d7a-933e-4638aab49 executors/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13/run /219c102b-28ae-41d5-b98f-11829315119e/docker.tar.gz'в' / var / lib / mesos / slaves / 632f9d21-ae71-4cca-95e4 -63e2b3dbd78e-S0 / рамки / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 / исполнители / sources.b4e2c8e6-5b42-11e7-aec0-024227901b13 / работает / 219c102b-28ae-41d5-b98f-11829315119e" I0627 19: 42: 52.070533 7613 fetcher.cpp: 582] Извлеченный файл: ///etc/docker.tar.gz 'в'/var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/executors/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13/runs/219c102b-28ae-41d5-b98f-11829315119e/docker.tar.gz" I0627 19:42:56.096325 7643 exec.cpp:162] Версия: 1.3.0 I0627 19:42:56.101958 7647 exec.cpp:237] Исполнитель зарегистрирован на агенте 632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0 ВНИМАНИЕ: Ваше ядро не поддерживает возможности ограничения свопинга, или cgroup не смонтирована. Память ограничена без подкачки. % Всего% Получено% Xferd Средняя скорость Время Время Время Текущий Dload Upload Всего отработанных левых скоростей 0 0 0 0 0 0 0 0 -: -: - -: -: - -: -: - 0 100 221 100 138 100 83 8657 5207 -: -: - -: -: - -: -: - 9200 E0627 19:51:03.219312 7652 process.cpp:951] Не удалось принять сокет: будущее отброшено
Сообщения Ваше ядро не поддерживает возможности ограничения свопа, или cgroup не смонтирована. Память ограничена без подкачки. и не удалось принять сокет: будущее отброшено, кажется, виновник, который убивает мой контейнер.
Мой вопрос: кто убивает мой контейнер через 5-10 минут снова и снова?
Я также обновил /etc/default/grub
файл с
GRUB_CMDLINE_LINUX_DEFAULT="cgroup_enable=memory swapaccount=1"
и перезагрузил мою систему, но без прогресса.
Любые идеи по этому вопросу.
Моя конфигурация Ubuntu VMWare выглядит так:
- Ядра назначены 3
- память: 6 ГБ
- HDD: 32 ГБ
- Я запускаю только один контейнер, но он выходит через несколько минут.
[РЕДАКТИРОВАТЬ: Добавление содержимого файла stderr из интерфейса mesos по адресу: /var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000 executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/runs/1bda209c-c2b8-4bb5-a41b-26361e00a284
]
Добавление содержимого файла stderr другого задания.
I0628 10: 15: 45.951104 4357 fetcher.cpp: 533] Информация о сборщике: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/29df799b-4797-41df-a005-465f211d286b-S0"," элементы ":[{" действие ":"BYPASS_CACHE" "URI":{"кэш": ложь, "исполняемый": ложные, "экстракт": истинные, "значение":" файл:\/\/\/ и т.д. \/docker.tar.gz"}}],"sandbox_directory":"\/ вар \ / Lib\/ Mesos \ / рабы \/29df799b-4797-41df-a005-465f211d286b-S0\/ рамки \/0e528b66-37aa-4d7a-933e-4638aabf494a-0000\/ исполнители \/sources.a634642c-5bbc-11e7-ba8b-024239f32c24\/ пробеги \/1bda209c-c2b8-4bb5-a41b-26361e00a284"} I0628 10:15:45.953835 4357 fetcher.cpp:444] Извлечение URI-файла:///etc/docker.tar.gz' I0628 10:15:45.953881 4357 fetcher.cpp:285] Загрузка непосредственно в каталог песочницы I0628 10:15:45.953974 4357 fetcher.cpp:222] Извлечение URI-файла:///etc/docker.tar.gz' I0628 10:15:45.956663 4357 fetcher.cpp:207] Скопированный ресурс '/etc/docker.tar.gz' в /var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/ исполнители / sources.a634642c-5bbc-11e7-ba8b-024239f32c24 / работает / 1bda209c-c2b8-4bb5-a41b-26361e00a284 / docker.tar.gz" I0628 10: 15: 46.061069 4357 fetcher.cpp: 123] Извлечено '/var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0 / frameworks / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/run /1bda209c-c2b8-4bb5-a41b-26361e00a284/docker.tar.gz'в' / var / lib / mesos / slaves / 29df799b-4700-41 -465f211d286b-S0 / рамки / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 / исполнители / sources.a634642c-5bbc-11e7-ba8b-024239f32c24 / работает / 1bda209c-c2b8-4bb5-a41b-26361e00a284' I0628 10: 15: 46.061148 4357 fetcher.cpp: 582] Извлеченный файл: ///etc/docker.tar.gz 'в'/var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/runs/1bda209c-c2b8-4bb5-a41b-26361e00a284/docker.tar.gz" I0628 10:15:49.898803 4389 exec.cpp:162] Версия: 1.3.0 I0628 10:15:49.903390 4390 exec.cpp:237] Исполнитель зарегистрирован на агенте 29df799b-4797-41df-a005-465f211d286b-S0 ВНИМАНИЕ: Ваше ядро не поддерживает возможности ограничения свопинга, или cgroup не смонтирована. Память ограничена без подкачки. % Всего% Получено% Xferd Средняя скорость Время Время Время Текущий Dload Upload Всего отработанных левых скоростей 0 0 0 0 0 0 0 0 -: -: - -: -: - -: -: - 0 100 221 100 138 100 83 5385 3239 -: -: - -: -: - -: -: - 11500 W0628 10:15:49.903390 4389 logging.cpp:91] RAW: принят сигнал SIGTERM от процесса 3287 пользователя 0; выход
Новые журналы не созданы в /var/lib/mesos-master.ERROR
подать сегодня Содержание /var/log/mesos-master.WARNING
файл:
Файл журнала создан в: 2017/06/28 10:04:56 Бег на машине: убунту Формат строки журнала: [IWEF] ммдд чч: мм: ss.uuuuuu файл потока: строка] msg W0628 10:04:56.387049 3193 authenticator.cpp:512] Учетные данные не предоставлены, запросы на аутентификацию будут отклонены W0628 10:14:56.617103 3221 master.cpp:2011] Агент 632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0 (ubuntu) не прошел перерегистрацию в течение 10 минут после сбоя главного устройства; отмечая его как недостижимый
Содержание /var/log/mesos-slave.WARNING
файл такой же, как если бы mesos-slave.ERROR
файл. Содержание /var/log/mesos-slave.ERROR
файл:
Файл журнала создан в: 2017/06/28 10:05:00 Бег на машине: убунту Формат строки журнала: [IWEF] ммдд чч: мм: ss.uuuuuu файл потока: строка] msg E0628 10:05:00.712286 3287 shell.hpp:107] Сбой команды 'hadoop version 2>&1'; это вывод: sh: 1: hadoop: не найдено E0628 10:24:45.502921 3326 slave.cpp:4496] Не удалось обновить ресурсы для контейнера 1bda209c-c2b8-4bb5-a41b-26361e00a284 executor 'sources.a634642c-5bbc-11e7-ba8b-024239f32c24b26434b4c2c34' 5b34b5c34c5b345346466426464642b2642642c5b5342b4642642324642644642642b53426426426426423256434464264264232564 все еще не запущены -11e7-ba8b-024239f32c24 при обновлении состояния для терминальной задачи, уничтожении контейнера: не удалось определить cgroup для подсистемы 'cpu': не удалось прочитать /proc/4469/cgroup: не удалось открыть файл: такого файла или каталога нет E0628 10:33:45.789072 3327 slave.cpp:4496] Не удалось обновить ресурсы для контейнера 858170ce-0775-48be-8c85-3a1dbf320569 исполнителя 'sources.e7e069ed-5bbd-11e7-ba8b-024239f32c24' с работающими источниками задачи.e7 -11e7-ba8b-024239f32c24 при обновлении состояния для терминальной задачи, уничтожении контейнера: не удалось определить cgroup для подсистемы 'cpu': не удалось прочитать /proc/5215/cgroup: не удалось открыть файл: нет такого файла или каталога
Я заметил, что сообщение:
Failed to read /proc/5215/cgroup: Failed to open file: No such file or directory
приходит только тогда, когда убит контейнер / задача. Принимая во внимание, что эти файлы существуют для текущих работающих контейнеров. Благодарю.
1 ответ
Кажется, что марафон полагаться на пользователя для осуществления проверки работоспособности. т.е. если мы предоставляем проверку работоспособности в настройках приложения, мы должны реализовать ее. Я удалил все проверки работоспособности, которые я указал в конфигурации приложения. После этого марафон показывает состояние приложения как неизвестное, но теперь марафон (в частности, mesos-slave) не убивает задачу.