13

こんにちは、hadoop で単語数を値でソートする方法を学びたいと思っていました。

値を並べ替えるには、partitioner、groupingcomparator、および sortcomparator が必要であることを知っています

しかし、これらの概念を一緒に適用して単語数を値でソートすることに少し混乱しています。

同じことを達成するために別のマップリデュースジョブが必要ですか、それともオカレンスをカウントしてここでソートし、同じものをリデューサーに出力するコンバイナーが必要ですか?

ワードカウントの例を値でソートする方法を説明できる人はいますか?

4

2 に答える 2

8

これを二次ソートと呼びます。詳細については、これこれを参照してください。

于 2013-08-23T15:11:33.967 に答える