データの可用性に基づいてワークフローをスケジュールしたいのですが、特定の頻度でデータが到着するわけではありません。また、データの再実行が複数回行われる可能性があるため、その日のデータの複数のバージョンがいつでも到着する可能性があります。
仕様からわかるように、現在、コーディネーターで周波数パラメーターを指定することが必須です。
ただし、頻度に依存せずに、何らかのイベント (データの到着またはパーティションの作成) のみに基づいてワークフローをトリガーしたいと考えています。
これは非同期データセットの資格があるようです。Oozie はまだ非同期データ セットをサポートしていますか?