文字列のソース(たとえば、テキストファイル)があり、多くの文字列が複数回繰り返されます。出現回数の多い順に上位X個の最も一般的な文字列を取得する必要があります。
最初に頭に浮かんだアイデアは、並べ替え可能なバッグ(org.apache.commons.collections.bag.TreeBagなど)を作成し、必要な順序でエントリを並べ替えるコンパレータを提供することでした。ただし、比較する必要のあるオブジェクトのタイプがわかりません。これは、TreeBagによって内部的に生成された、オブジェクト(String)と発生数を組み合わせたある種の内部マップである必要があります。これは可能ですか?
または、たとえばJavaでHashMapを値で並べ替えるなどの説明に従って、ハッシュマップを使用して値で並べ替える方がよいでしょうか。