0

などの POS タグが付いた単語を含むファイルがあります。

Tom/NNP went/VBP to/IN the/DT stadium/NN ....etc

このファイルに含まれるすべての名詞の頻度を知る必要があります。したがって、出力は次のようになります

stadium     12 
football    20
player      13

ここで、これらの数字は、これらの名詞がテキストに出現する数字の時間です。Javaでこれを行うにはどうすればよいですか?

4

1 に答える 1

1

文字列 (名詞) から整数 (カウント) へのマップを用意します。ファイル内の各単語をループします。「/」の後の単語の部分を調べ、それが名詞である場合は、マップにまだ含まれていない場合は「1」の値で配置するか、既存の値に 1 を追加します。次に、マップを反復処理して、キーと値のペアを出力します。

于 2012-10-08T19:22:27.023 に答える