2

特定のユースケースでしばらくレデューサージョブを使用していませんが、「マッパーなし」のジョブにまだ遭遇したことはありません。「マッパーなし」とは、mapreduce フレームワークが入力ファイルを読み取り、(InputFormat? に基づいて) 何らかの方法でそれらをシャッフル/ソートし、それらがレデューサーへの入力になることを意味しますか?

4

3 に答える 3

5

「マッパーなし」は「ID マッパー」の婉曲表現です。指定しない場合のデフォルトのマッパーはそれだけです。少なくとも、ID マッパー プロセスは、変更されていない入力を適切なレデューサー パーティションに転送します。

于 2012-08-01T22:21:04.957 に答える
1

入力キーに基づく集計関数の一部では、ID マッパーが適しています。マッパーは入力と同じ i/o キーを発行し、リデューサーは特定のキーの値を集約します。

于 2012-08-02T02:21:47.457 に答える