1

私はHadoopの初心者です。

私の理解によると、Hadoop フレームワークはジョブを FIFO 順 (デフォルトのスケジューリング) で実行します。

特定の時間にジョブを実行するようにフレームワークに指示する方法はありますか?

つまり、そのように毎日午後 3 時にジョブを実行するように設定する方法はありますか?

これに関するご意見は大歓迎です。

ありがとう、R

4

4 に答える 4

4

Quartzなどの外部Javaスケジュールフレームワークからジョブを呼び出すのはどうですか?その後、必要に応じてジョブを実行できます。

于 2011-08-18T09:25:26.157 に答える
4

Oozie ( http://yahoo.github.com/oozie/ ) の使用を検討してください。それは(他のものに加えて)可能にします:

実行頻度: Oozie ワークフロー仕様は、データ トリガーと時間トリガーの両方をサポートします。ユーザーは実行頻度を指定でき、データの到着を待ってワークフロー内のアクションをトリガーできます。

他の Hadoop スケジューラーとは独立しており、それらのいずれとも連携する必要があるため、Hadoop 構成の変更はおそらくありません。

于 2011-08-19T08:29:17.297 に答える
0

Cronがそれをカットしない場合、および/またはカスタムワークフローソリューションを使用する場合は、商用のスケジューリングアプリを使用します. jams と呼ばれるソリューションを使用していますが、これは .net 指向であることを忘れないでください。

于 2012-07-25T18:16:48.960 に答える
0

Hadoop ジョブを実行するスクリプトを作成し、at コマンドを使用して指定した時間に実行するのはどうでしょうか。ジョブを定期的に実行する場合は、スクリプトを実行する cron ジョブをセットアップできます。

于 2012-02-01T07:29:26.500 に答える