私はmapred.reduce.tasks = 100
(実験しているだけで)Hadoopジョブを実行しています。生成されるマップの数は、入力分割に依存するため、537です。問題は、並行して「実行中」のレデューサーの数が4を超えないことです。マップが100%完成した後でも。CPU使用率が最適ではなく、Reduceが非常に遅いため、実行中のレデューサーの数を増やす方法はありますか?
私も設定しmapred.tasktracker.reduce.tasks.maximum = 100
ました。しかし、これは並行して実行されているレデューサーの数には影響しないようです。