oozie は Hadoop プラットフォーム用のワークフロー エンジンですが、MapReduce ジョブの DAG 依存関係の実行のパフォーマンスは向上しますか?
つまり、1 つの MapReduce ジョブの出力が DAG 内の次の MapReduce ジョブへの入力として与えられるため、oozie は中間結果をメモリに格納して I/O を節約するメカニズムを提供します。
それとも、依存する一連の MapReduce を調整するのは、単なるワークフロー マネージャーですか?
内部で oozie がどのように機能するか知りたいですか?