Как отладить действие Oozie, застрявшее в состоянии DONE
У меня есть рабочий процесс Oozie, который используется для всех заданий, и через несколько дней некоторые из представленных заданий застряли в режиме RUNNING. Глядя на работу, последнее действие в состоянии Готово.
oozie job -info 0014479-180613114934364-oozie-mapr-W
...
----------------------------------------------------------------------------------------------------------
ID Status Ext ID Ext Status Err Code
----------------------------------------------------------------------------------------------------------
....
0014479-180613114934364-oozie-mapr-W@FilerDecision DONE - SequencerDecision-
Что странно, так это то, что Hadoop не использует действие, оно просто основано на переменной True
или же False
<workflow-app name="${oozie_control_chain_token}" xmlns="uri:oozie:workflow:0.5">
<start to="FilerDecision"/>
<!--check if we need to do the filer -->
<decision name="FilerDecision">
<switch>
<case to="FilerStep">${oozie_control_enable_filer eq "True"}</case>
<default to="SequencerDecision"/>
</switch>
</decision>
...
Перезапуск любого сервиса, связанного с Oozie (oozie service, resourcemanager, mariadb) не исправляет.
Я также приостановил и возобновил все работы, застрявшие в этом состоянии, но тоже не помогает.
Есть ли у вас рекомендации по устранению подобных проблем?