私は自分で単語数の例を実装しようとしています。これがマッパーの実装です。
public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> {
public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
Text word = new Text();
String line = value.toString();
StringTokenizer tokenizer = new StringTokenizer(line);
while (tokenizer.hasMoreTokens()) {
word.set(tokenizer.nextToken());
context.write(word, new IntWritable(1));
}
}
}
およびレデューサー:
public static class Reduce extends Reducer<Text, IntWritable, Text, IntWritable> {
public void reduce(Text key, Iterator<IntWritable> values, Context context) throws IOException, InterruptedException {
int sum = 0;
while (values.hasNext())
sum += values.next().get();
context.write(key, new IntWritable(sum));
}
}
しかし、このコードを実行するために取得する出力は、マッパーのみの出力のように見えます。たとえば、入力が「hello world hello」の場合、出力は次のようになります。
hello 1
hello 1
world 1
また、マッピングとリダクションの間でコンバイナーを使用します。このコードの何が問題になっているのか誰かに説明してもらえますか?
どうもありがとう!