MapReduce ジョブ (関連する場合は具体的には Hadoop) を作成するときは、キーと値のペアのシーケンスを生成するmap()
と関数を定義する必要があります。reduce()
キーと値のデータ型は、アプリケーションで自由に定義できます。
(string, int)
単語カウントの標準的な例では、両方の関数が、キーが単語であり、値が出現回数である型のペアを生成します。ここでは、私が見た他のすべての例と同様に、出力されたキーと値の型は 2 つの関数間で一貫しています。
MapReduce のアプリケーション内で生成されたキーmap()
と値のペアの型は同じである必要がありますか? reduce()
はいの場合:なぜですか?