3

Ozzie の出力イベントの用途がわかりません。Ozzie のドキュメントには、「コーディネーター アクションは 1 つ以上のデータセット インスタンスを出力として生成できる」と記載されていますが、実用的な詳細や例は示されていません。出力としてデータセット インスタンスを生成するとはどういう意味ですか? Ozzie がデータセットの URI テンプレートによってフォルダーを出力として作成するということですか? 出力イベントを使用する必要がある理由がよくわかりません...

ありがとう!

4

2 に答える 2

2

<output-event>コーディネーターで sを指定する用途が少なくとも 1 つあります。oozie job -rerun(コマンドを使用して) 日付の範囲でコーディネーターを再実行すると、 <output-event>s として指定されたすべての対応するパスが削除されます。

コーディネーターのインスタンスによって生成されたすべての出力を削除すると便利な場合があります。たとえば、これらのパスを<input-event>s として持つ別のコーディネーターを開始したい場合や、古いデータの代わりに再実行データを処理することを確認したい場合です。

于 2014-08-13T14:43:35.747 に答える
1

Oozie について話している場合、出力ファイルはさまざまなコーディネーター ジョブを接続するために使用されます。コーディネーター ジョブの大きな DAG を考えてみましょう。一部のジョブは、他のジョブの出力を入力として受け取る場合があります。したがって、データセットは DAG のエッジです。

たとえば、Oozie 構成ファイルで、コーディネーター A の出力を DS1、コーディネーター B の出力を DS2、コーディネーター C の入力を DS1、DS2 と指定すると、Oozie はコーディネーター C の対応するアクションが実行されないことを保証します。 DS1 と DS2 の準備が整う前に。

于 2012-11-03T02:42:04.443 に答える