これを行うためのHadoop用のApacheOozieワークフロースケジューラがあります。
Oozieは、ApacheHadoopジョブを管理するためのワークフロースケジューラシステムです。
Oozieワークフロージョブは、アクションの有向非巡回グラフ(DAG)です。
Oozie Coordinatorジョブは、時間(頻度)とデータの可用性によってトリガーされる繰り返しのOozieワークフロージョブです。
Oozieは、Hadoopスタックの残りの部分と統合されており、すぐに使用できるいくつかのタイプのHadoopジョブ(Java map-reduce、Streaming map-reduce、Pig、Hive、Sqoop、Distcpなど)とシステム固有のジョブ( Javaプログラムとシェルスクリプト)。
Oozieは、スケーラブルで信頼性が高く、拡張可能なシステムです。
これは、apacheoozieを構成するためのElasticMap Reduceブートストラップアクションの簡単な例です:https ://github.com/lila/emr-oozie-sample
しかし、oozieは少し複雑であり、スケジュール/監視/保守するジョブがたくさんある場合にのみ、2つまたは3つと言った場合は、あなただけが行くoozie
か、たくさんのジョブを作成する必要があります。cron
定期的にスケジュールされるジョブ。
また、Amazonの簡単なワークフローを調べて調べることもできます。