問題タブ [apache-falcon]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
etl - アパッチ NIFI vs アパッチ エアフロー vs アパッチ ファルコン ? 以下のシナリオに最も適しているのはどれですか?
さまざまなベンダーに属する REST API を介して一連のデバイスと通信する Java のソリューションを開発しています。したがって、ベンダーごとに、ソリューション内で実行する必要がある一連のプロセスがあります。ただし、これらのプロセスは各ベンダーによって異なります。以下は、実行する必要がある高レベルのプロセスです。
Retrieve an XML file from a folder
Process the XML file
Perform some image processing
Schedule a job and execute it on the scheduled time
Storing data on a MySQL DB and perform some REST calls to outside APIs
したがって、1 つのベンダーが上記のすべてのプロセスを持っている可能性があります。しかし、別の場合、いくつかのプロセスがない場合があります (例: 画像処理)。選択したソリューションから、次のことが得られるはずです。
I should be able to create custom workflows for new vendors
Need to identify any failures that have been occurred within the workflow and perform retry mechanisms.
Should be able to execute some functions parallelly (Eg: Image processing)
Scalable
Opensource
そこで、Nifi/Airflow/Falcon などのワークフロー マネージャーを調べるように言われました。それらについていくつかの調査を行いましたが、最適な解決策を最終決定することはできませんでした。
注: Hadoop またはその他のクラスターを使用する必要はなく、データ フローの頻度はそれほど高くありません。
現在、Nifiの使用を考えています。とありますが、どなたかご意見をいただけないでしょうか。私のユースケースに最適なソリューションは何ですか?