複数のファイルから単語の出現頻度をカウントしたい。
さらに、これらのファイルにはこれらの単語があります
a1.txt = {aaa, aaa, aaa}
a2.txt = {aaa}
a3.txt = {aaa, bbb}
したがって、結果は aaa = 3、bbb = 1 でなければなりません。
次に、上記のデータ構造を定義しました。
LinkedHashMap<String, Integer> wordCount = new LinkedHashMap<String, Integer>();
Map<String, LinkedHashMap<String, Integer>>
fileToWordCount = new HashMap<String,LinkedHashMap<String, Integer>>();
次に、ファイルから単語を読み取り、wordCount と fileToWordCount に入れます。
/*lineWords[i] is a word from a line in the file*/
if(wordCount.containsKey(lineWords[i])){
System.out.println("1111111::"+lineWords[i]);
wordCount.put(lineWords[i], wordCount.
get(lineWords[i]).intValue()+1);
}else{
System.out.println("222222::"+lineWords[i]);
wordCount.put(lineWords[i], 1);
}
fileToWordCount.put(filename, wordCount); //here we map filename
and occurences of words
最後に、上記のコードで fileToWordCount を出力します。
Collection a;
Set filenameset;
filenameset = fileToWordCount.keySet();
a = fileToWordCount.values();
for(Object filenameFromMap: filenameset){
System.out.println("FILENAMEFROMAP::"+filenameFromMap);
System.out.println("VALUES::"+a);
}
そして版画、
FILENAMEFROMAP::a3.txt
VALUES::[{aaa=5, bbb=1}, {aaa=5, bbb=1}, {aaa=5, bbb=1}]
FILENAMEFROMAP::a1.txt
VALUES::[{aaa=5, bbb=1}, {aaa=5, bbb=1}, {aaa=5, bbb=1}]
FILENAMEFROMAP::a2.txt
VALUES::[{aaa=5, bbb=1}, {aaa=5, bbb=1}, {aaa=5, bbb=1}]
では、マップ fileToWordCount を使用して、ファイル内の単語の頻度を見つけるにはどうすればよいでしょうか?