10 個のデータ ノードのクラスターで Map reduce プログラムのパフォーマンス テストを試みていました。プロセス中、私は 5 の Reducer を使用し、次に 10 のように処理しました。
レデューサーの数を増やすとジョブの終了も速くなると考えていましたが、30 を超えると、70 まで数を増やしてもジョブの実行時間に違いはありませんでしたが、400 を超える一意のキーがあり、増加していますレデューサーの数が 30 を超えると違いが生じるはずです。
これに特定の理由があるかどうかを理解するのを手伝ってくれる人はいますか?
前もって感謝します