マッパーがレデューサーごとに1つのパーティションを生成することを理解しています。レデューサーはどのパーティションをコピーするかをどのように知るのですか?単語数プログラム用のマッパーを実行している2つのノードがあり、2つのレデューサーが構成されているとします。各マップノードが2つのパーティションを生成し、両方のノードにキーと同じ単語が含まれている可能性がある場合、レデューサーはどのように正しく機能しますか?
例:
ノード1がパーティション1とパーティション2を生成し、パーティション1に「WHO」という名前のキーが含まれている場合。
ノード2がパーティション3とパーティション4を生成し、パーティション3に「WHO」という名前のキーが含まれている場合。
パーティション1とパーティション4がレデューサー1に移動した(そしてレデューサー2に残っている)場合、レデューサー1はどのようにして正しい単語数を計算しますか?
これが不可能で、パーティション1と3がレデューサー1に移動する場合、Hadoopはこれをどのように実行しますか?異なるノードからの特定のキーと値のペアが常に同じレデューサーに送られるようにしますか?もしそうなら、それはどのようにこれを行いますか?
ありがとう、Suresh。