Hadoop 1.0.4 で多くの (おそらく 12) のジョブを実行する必要があります。最初に5つを並行して実行し、すべてが終了したら他の4つのジョブを並行して実行し、最後に最後の3つを再度実行して並行して実行します。Hadoop 1.0.4 で設定するにはどうすればよいですか。すべてのジョブが並列ではなく互いに実行されていることがわかります。
1151 次
JobControl API は、MR ジョブの依存関係に使用できます。複雑なワークフローの場合は、OozieまたはAzkabanをお勧めします。こちらはウージーvsアズカバン。