Javaで複数のファイル/ドキュメントへの単語の頻度をカウントしたい.
例えば
a1 = {aaa,aaa,aaa,bbb}
a2 = {aaa, aaa, hhh}
a3 = {aaa, hhh, bbb, bbb}
したがって、すべてのファイルの単語頻度をカウントしたいと思います。
for a1 file {aaa = 3, bbb = 1}
for a2 file {aaa = 2, hhh = 1}
for a3 file {aaa = 1, hhh = 1, bbb =2}
から単語を読み取り、file
に格納<wordname, worcount>
するメソッドがありますLinkedHashMap
。それにもかかわらず、これはすべてのファイルの特定の単語の頻度をカウントしますが、ファイルごとに単語の頻度を個別にカウントしたいと思います。
誰にも解決策はありますか?
それから、私はこれを書きました:
Set mapset = fileToWordCount.keySet();
for(Object filenameFromMap: mapset){
System.out.println("FILENAME::"+filenameFromMap);
}
しかし、それは何も印刷しません。