ビッグデータを分析するためのデシジョンツリーの実装に関するグーグルペーパーでは、フォワードスケジューリングマップリデュースジョブについて何か言及しています。
現在実行するジョブが2つある場合、最初のジョブを実行し、2番目のジョブのセットアップを開始すると彼らは言います。最初のジョブがいつ完了したかを確認するためのスレッドがあり、完了したら、入力を2番目のジョブにフィードして開始します。彼らが言及するアルゴリズムには反復的な仕事があるので、これは彼らに多くの時間を節約します。
これをHadoopでどのように実行できるのでしょうか。これが論文の引用です。フォワードスケジューリングは6.1項にあります