0

私はたくさん検索しましたが、すべてのマップ タスクで、バッファの内容がしきい値に達すると、スレッドが削減数に従ってデータを分割することを知っていました。削減数の役割は何ですか? マップでパーティショニングが発生するのはなぜですか?マップ フェーズにどのように役立つのですか?ソート後、スレッドはコンテンツをディスクにスピルします。それはどのように起こりますか?ここにこぼれることの意味を理解できません..... ありがとう。

4

1 に答える 1

0

レデューサーがレデューサーに関連する各マッパーからすべてのデータをポーリングしてプルするときに、マップはデータを分割する必要があります。

逆に想像すると、レデューサーは各マップからすべての出力をプルし、各マッパーから各レデューサーにすべてのデータ出力を送信することになり、非常に非効率的です。

そのため、マッパーでパーティショニングすることにより、リデューサーは各マッパーから削減する必要があるデータをクエリしてプルバックすることができます。

于 2013-02-02T14:02:16.220 に答える