Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
特定のユースケースでしばらくレデューサージョブを使用していませんが、「マッパーなし」のジョブにまだ遭遇したことはありません。「マッパーなし」とは、mapreduce フレームワークが入力ファイルを読み取り、(InputFormat? に基づいて) 何らかの方法でそれらをシャッフル/ソートし、それらがレデューサーへの入力になることを意味しますか?
「マッパーなし」は「ID マッパー」の婉曲表現です。指定しない場合のデフォルトのマッパーはそれだけです。少なくとも、ID マッパー プロセスは、変更されていない入力を適切なレデューサー パーティションに転送します。
入力キーに基づく集計関数の一部では、ID マッパーが適しています。マッパーは入力と同じ i/o キーを発行し、リデューサーは特定のキーの値を集約します。