MapReduce 実行の特定のフェーズで Hadoop クラスターのベンチマークを行うことに興味があります。つまり、map フェーズ、shuffle フェーズ、reduce フェーズを明確に分離したいと考えています。
すべてのマップ タスクが終了する前に何かをシャッフルまたは削減することを控え、すべてのシャッフルが終了するまで削減を控える方法はありますか? これらの各フェーズでのリソース消費のみに関心があるため、実行時間への影響は気にしません。
特定のノードでのタスクの分離に関する別の SO 投稿を見ました。これは、削減してはならないノードとマップしてはならないノードを設定mapred.tasktracker.reduce.tasks.maximum
することによって行われますが、この場合、マップと削減のタスクはまだ同時に実行されており、私もできません。各フェーズで完全なクラスターを使用します。0
mapred.tasktracker.map.tasks.maximum
0
ありがとう!