Как отладить действие Oozie, застрявшее в состоянии DONE

У меня есть рабочий процесс Oozie, который используется для всех заданий, и через несколько дней некоторые из представленных заданий застряли в режиме RUNNING. Глядя на работу, последнее действие в состоянии Готово.

oozie job -info 0014479-180613114934364-oozie-mapr-W
...
----------------------------------------------------------------------------------------------------------
ID                                                    Status    Ext ID                 Ext Status Err Code
----------------------------------------------------------------------------------------------------------
....
0014479-180613114934364-oozie-mapr-W@FilerDecision    DONE      -                      SequencerDecision-

Что странно, так это то, что Hadoop не использует действие, оно просто основано на переменной True или же False

<workflow-app name="${oozie_control_chain_token}" xmlns="uri:oozie:workflow:0.5">
    <start to="FilerDecision"/>

    <!--check if we need to do the filer -->
    <decision name="FilerDecision">
        <switch>
            <case to="FilerStep">${oozie_control_enable_filer eq "True"}</case>
            <default to="SequencerDecision"/>
        </switch>
    </decision>
    ...

Перезапуск любого сервиса, связанного с Oozie (oozie service, resourcemanager, mariadb) не исправляет.

Я также приостановил и возобновил все работы, застрявшие в этом состоянии, но тоже не помогает.

Есть ли у вас рекомендации по устранению подобных проблем?

0 ответов

Другие вопросы по тегам