Кто убивает мой докер контейнер?

Mesos → Выполненные задачи в песочнице. В файле stdout я вижу сигнал killTask:

Received killTask for task sources.b4e2c8e6-5b42-11e7-aec0-024227901b13

Полная привязка стандартного файла выглядит следующим образом. Вы можете увидеть даже после получения killTask сигнал мой процесс все еще работает. то есть мой процесс не заканчивается сам.

 
2017-06-27 14: 16: 08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:16:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:16:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:16:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:16:48,337 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:16:58,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:08,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:38,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправленные сообщения appmonitor 1, пока отправлено 188 байт
2017-06-27 14:17:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:08,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:18,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:38,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:18:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:18,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:48,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:19:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:20:08,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:20:18,334 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:20:28,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:20:38,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
2017-06-27 14:20:48,332 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт
Получено killTask ​​для источников задач.b4e2c8e6-5b42-11e7-aec0-024227901b13
2017-06-27 14:20:58,333 ИНФОРМАЦИЯ [Timer-0] com.informatica.vds.transport.ws.WSClient - отправлено сообщений от appmonitor 2, пока отправлено 376 байт

Полный снимок файла stderr выглядит следующим образом:

I0627 19: 42: 51.959991 7613 fetcher.cpp: 533] Информация о сборщике: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0"," элементы ":[{" действие ":"BYPASS_CACHE" "URI":{"кэш": ложь, "исполняемый": ложные, "экстракт": истинные, "значение":" файл:\/\/\/ и т.д. \/docker.tar.gz"}}],"sandbox_directory":"\/ вар \ / Lib\/ Mesos \ / рабы \/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0\/ рамки \/0e528b66-37aa-4d7a-933e-4638aabf494a-0000\/ исполнители \/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13\/ пробеги \/219c102b-28ae-41d5-b98f-11829315119e"}
I0627 19:42:51.963241  7613 fetcher.cpp:444] Извлечение URI-файла:///etc/docker.tar.gz'
I0627 19:42:51.963279  7613 fetcher.cpp:285] Загрузка непосредственно в каталог песочницы
I0627 19:42:51.963295  7613 fetcher.cpp:222] Извлечение URI-файла:///etc/docker.tar.gz'
I0627 19:42:51.964923  7613 fetcher.cpp:207] Скопированный ресурс '/etc/docker.tar.gz' в /var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/ исполнители / sources.b4e2c8e6-5b42-11e7-aec0-024227901b13 / работает / 219c102b-28ae-41d5-b98f-11829315119e / docker.tar.gz"
I0627 19: 42: 52.070482 7613 fetcher.cpp: 123] Извлечено '/var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/ frameworks / 0e528b66-37aa-4d7a-933e-4638aab49 executors/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13/run /219c102b-28ae-41d5-b98f-11829315119e/docker.tar.gz'в' / var / lib / mesos / slaves / 632f9d21-ae71-4cca-95e4 -63e2b3dbd78e-S0 / рамки / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 / исполнители / sources.b4e2c8e6-5b42-11e7-aec0-024227901b13 / работает / 219c102b-28ae-41d5-b98f-11829315119e"
I0627 19: 42: 52.070533 7613 fetcher.cpp: 582] Извлеченный файл: ///etc/docker.tar.gz 'в'/var/lib/mesos/slaves/632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/executors/sources.b4e2c8e6-5b42-11e7-aec0-024227901b13/runs/219c102b-28ae-41d5-b98f-11829315119e/docker.tar.gz"
I0627 19:42:56.096325  7643 exec.cpp:162] Версия: 1.3.0
I0627 19:42:56.101958  7647 exec.cpp:237] Исполнитель зарегистрирован на агенте 632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0
ВНИМАНИЕ: Ваше ядро ​​не поддерживает возможности ограничения свопинга, или cgroup не смонтирована. Память ограничена без подкачки.
  % Всего% Получено% Xferd Средняя скорость Время Время Время Текущий
                                 Dload  Upload Всего отработанных левых скоростей

  0 0 0 0 0 0 0 0 -: -: - -: -: - -: -: - 0
100 221 100 138 100 83 8657 5207 -: -: - -: -: - -: -: -  9200
E0627 19:51:03.219312  7652 process.cpp:951] Не удалось принять сокет: будущее отброшено

Сообщения Ваше ядро ​​не поддерживает возможности ограничения свопа, или cgroup не смонтирована. Память ограничена без подкачки. и не удалось принять сокет: будущее отброшено, кажется, виновник, который убивает мой контейнер.

Мой вопрос: кто убивает мой контейнер через 5-10 минут снова и снова?

Я также обновил /etc/default/grub файл с

GRUB_CMDLINE_LINUX_DEFAULT="cgroup_enable=memory swapaccount=1"

и перезагрузил мою систему, но без прогресса.

Любые идеи по этому вопросу.

Моя конфигурация Ubuntu VMWare выглядит так:

  1. Ядра назначены 3
  2. память: 6 ГБ
  3. HDD: 32 ГБ
  4. Я запускаю только один контейнер, но он выходит через несколько минут.

[РЕДАКТИРОВАТЬ: Добавление содержимого файла stderr из интерфейса mesos по адресу: /var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000 executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/runs/1bda209c-c2b8-4bb5-a41b-26361e00a284 ]

Добавление содержимого файла stderr другого задания.

I0628 10: 15: 45.951104 4357 fetcher.cpp: 533] Информация о сборщике: {"cache_directory":"\/tmp\/mesos\/fetch\/slaves\/29df799b-4797-41df-a005-465f211d286b-S0"," элементы ":[{" действие ":"BYPASS_CACHE" "URI":{"кэш": ложь, "исполняемый": ложные, "экстракт": истинные, "значение":" файл:\/\/\/ и т.д. \/docker.tar.gz"}}],"sandbox_directory":"\/ вар \ / Lib\/ Mesos \ / рабы \/29df799b-4797-41df-a005-465f211d286b-S0\/ рамки \/0e528b66-37aa-4d7a-933e-4638aabf494a-0000\/ исполнители \/sources.a634642c-5bbc-11e7-ba8b-024239f32c24\/ пробеги \/1bda209c-c2b8-4bb5-a41b-26361e00a284"}
I0628 10:15:45.953835  4357 fetcher.cpp:444] Извлечение URI-файла:///etc/docker.tar.gz'
I0628 10:15:45.953881  4357 fetcher.cpp:285] Загрузка непосредственно в каталог песочницы
I0628 10:15:45.953974  4357 fetcher.cpp:222] Извлечение URI-файла:///etc/docker.tar.gz'
I0628 10:15:45.956663  4357 fetcher.cpp:207] Скопированный ресурс '/etc/docker.tar.gz' в /var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/ исполнители / sources.a634642c-5bbc-11e7-ba8b-024239f32c24 / работает / 1bda209c-c2b8-4bb5-a41b-26361e00a284 / docker.tar.gz"
I0628 10: 15: 46.061069 4357 fetcher.cpp: 123] Извлечено '/var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0 / frameworks / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/run /1bda209c-c2b8-4bb5-a41b-26361e00a284/docker.tar.gz'в' / var / lib / mesos / slaves / 29df799b-4700-41 -465f211d286b-S0 / рамки / 0e528b66-37aa-4d7a-933e-4638aabf494a-0000 / исполнители / sources.a634642c-5bbc-11e7-ba8b-024239f32c24 / работает / 1bda209c-c2b8-4bb5-a41b-26361e00a284'
I0628 10: 15: 46.061148 4357 fetcher.cpp: 582] Извлеченный файл: ///etc/docker.tar.gz 'в'/var/lib/mesos/slaves/29df799b-4797-41df-a005-465f211d286b-S0/frameworks/0e528b66-37aa-4d7a-933e-4638aabf494a-0000/executors/sources.a634642c-5bbc-11e7-ba8b-024239f32c24/runs/1bda209c-c2b8-4bb5-a41b-26361e00a284/docker.tar.gz"
I0628 10:15:49.898803  4389 exec.cpp:162] Версия: 1.3.0
I0628 10:15:49.903390  4390 exec.cpp:237] Исполнитель зарегистрирован на агенте 29df799b-4797-41df-a005-465f211d286b-S0
ВНИМАНИЕ: Ваше ядро ​​не поддерживает возможности ограничения свопинга, или cgroup не смонтирована. Память ограничена без подкачки.
  % Всего% Получено% Xferd Средняя скорость Время Время Время Текущий
                                 Dload  Upload Всего отработанных левых скоростей

  0 0 0 0 0 0 0 0 -: -: - -: -: - -: -: - 0
100 221 100 138 100 83 5385 3239 -: -: - -: -: - -: -: - 11500
W0628 10:15:49.903390  4389 logging.cpp:91] RAW: принят сигнал SIGTERM от процесса 3287 пользователя 0; выход

Новые журналы не созданы в /var/lib/mesos-master.ERROR подать сегодня Содержание /var/log/mesos-master.WARNING файл:

Файл журнала создан в: 2017/06/28 10:04:56
Бег на машине: убунту
Формат строки журнала: [IWEF] ммдд чч: мм: ss.uuuuuu файл потока: строка] msg
W0628 10:04:56.387049  3193 authenticator.cpp:512] Учетные данные не предоставлены, запросы на аутентификацию будут отклонены
W0628 10:14:56.617103  3221 master.cpp:2011] Агент 632f9d21-ae71-4cca-95e4-63e2b3dbd78e-S0 (ubuntu) не прошел перерегистрацию в течение 10 минут после сбоя главного устройства; отмечая его как недостижимый

Содержание /var/log/mesos-slave.WARNING файл такой же, как если бы mesos-slave.ERROR файл. Содержание /var/log/mesos-slave.ERROR файл:

Файл журнала создан в: 2017/06/28 10:05:00
Бег на машине: убунту
Формат строки журнала: [IWEF] ммдд чч: мм: ss.uuuuuu файл потока: строка] msg
E0628 10:05:00.712286  3287 shell.hpp:107] Сбой команды 'hadoop version 2>&1'; это вывод:
sh: 1: hadoop: не найдено
E0628 10:24:45.502921  3326 slave.cpp:4496] Не удалось обновить ресурсы для контейнера 1bda209c-c2b8-4bb5-a41b-26361e00a284 executor 'sources.a634642c-5bbc-11e7-ba8b-024239f32c24b26434b4c2c34' 5b34b5c34c5b345346466426464642b2642642c5b5342b4642642324642644642642b53426426426426423256434464264264232564 все еще не запущены -11e7-ba8b-024239f32c24 при обновлении состояния для терминальной задачи, уничтожении контейнера: не удалось определить cgroup для подсистемы 'cpu': не удалось прочитать /proc/4469/cgroup: не удалось открыть файл: такого файла или каталога нет
E0628 10:33:45.789072  3327 slave.cpp:4496] Не удалось обновить ресурсы для контейнера 858170ce-0775-48be-8c85-3a1dbf320569 исполнителя 'sources.e7e069ed-5bbd-11e7-ba8b-024239f32c24' с работающими источниками задачи.e7 -11e7-ba8b-024239f32c24 при обновлении состояния для терминальной задачи, уничтожении контейнера: не удалось определить cgroup для подсистемы 'cpu': не удалось прочитать /proc/5215/cgroup: не удалось открыть файл: нет такого файла или каталога

Я заметил, что сообщение:

Failed to read /proc/5215/cgroup: Failed to open file: No such file or directory

приходит только тогда, когда убит контейнер / задача. Принимая во внимание, что эти файлы существуют для текущих работающих контейнеров. Благодарю.

1 ответ

Решение

Кажется, что марафон полагаться на пользователя для осуществления проверки работоспособности. т.е. если мы предоставляем проверку работоспособности в настройках приложения, мы должны реализовать ее. Я удалил все проверки работоспособности, которые я указал в конфигурации приложения. После этого марафон показывает состояние приложения как неизвестное, но теперь марафон (в частности, mesos-slave) не убивает задачу.

Другие вопросы по тегам