6

データの可用性に基づいてワークフローをスケジュールしたいのですが、特定の頻度でデータが到着するわけではありません。また、データの再実行が複数回行われる可能性があるため、その日のデータの複数のバージョンがいつでも到着する可能性があります。

仕様からわかるように、現在、コーディネーターで周波数パラメーターを指定することが必須です。

ただし、頻度に依存せずに、何らかのイベント (データの到着またはパーティションの作成) のみに基づいてワークフローをトリガーしたいと考えています。

これは非同期データセットの資格があるようです。Oozie はまだ非同期データ セットをサポートしていますか?

4

1 に答える 1