こんにちは、hadoop で単語数を値でソートする方法を学びたいと思っていました。
値を並べ替えるには、partitioner、groupingcomparator、および sortcomparator が必要であることを知っています
しかし、これらの概念を一緒に適用して単語数を値でソートすることに少し混乱しています。
同じことを達成するために別のマップリデュースジョブが必要ですか、それともオカレンスをカウントしてここでソートし、同じものをリデューサーに出力するコンバイナーが必要ですか?
ワードカウントの例を値でソートする方法を説明できる人はいますか?