9

Amazon の Elastic Map Reduce を使用して、次の 3 つの ActionOnFailure 選択肢のいずれかをステップに指定できることがわかりました。

  • TERMINATE_JOB_FLOW
  • CANCEL_AND_WAIT
  • 継続する

TERMINATE_JOB_FLOW はデフォルトであり、明らかです。ステップで障害が発生すると、クラスター全体がシャットダウンされます。

CANCEL_AND_WAIT と CONTINUE の違いは何ですか? どちらもクラスターを実行し続け、追加されたら次のステップに進むように見えます。

4

1 に答える 1

13

クラスターを起動し、次の 3 つのステップを追加したとします。

  • ステップ1
  • ステップ2
  • Step3

Now, if Step1 has ActionOnFailure as CANCEL_AND_WAIT, then in the event on failure of Step1, it would cancel all the remaining steps and the cluster will get into a Waiting status. And I guess if you laucng your cluster with --stay-alive option then this is the default behaviour.

if Step1 has ActionOnFailure as CONTINUE, then in the event on failure of Step1, it would continue with the execution of Step2.

if Step1 has ActionOnFailure as TERMINATE_JOB_FLOW, then in the event on failure of Step1, it would shut down the cluster as you mentioned.

于 2013-03-08T19:45:12.113 に答える