4

単語の語幹を取得するために、MIT の JWI (Java API for WordNet) に実装されているステマーメソッドを正しく使用するにはどうすればよいですか? ステマーを初期化して findStems メソッドを使用する方法がわかりません。

4

3 に答える 3

6

追加のライブラリは必要ありませんが、辞書は必要です。プリンストンからダウンロードできます: https://wordnet.princeton.edu/wordnet/download/current-version/

「WordNet 3.1 データベース ファイルのみ」のセクションから辞書のみをダウンロードして、アーカイブを展開することをお勧めします。PATH/dict が出力の場所であると仮定すると、次のコードを使用できます。

Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);

List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
    System.out.println(test.get(i));
}

この例の出力は「foot」です。

于 2014-04-15T16:25:32.433 に答える
1

これは、sakthi の回答に対するコメントを意味します。実際には、メソッドを呼び出すときに、探している POS (名詞、形容詞、動詞など) を正確に指定する必要がありますfindStems(JWI v2.2.3): http://projects.csail .mit.edu/jwi/api/edu/mit/jwi/morph/IStemmer.html

于 2012-11-15T08:32:30.280 に答える
0

使用される jar ファイルは、edu.mit.jwi_2.1.4.jar および edu.sussex.nlp.jws.beta.11.jar です。

JWS ws = new JWS("C:/Program Files/WordNet","2.1");  
WordnetStemmer stem =  new WordnetStemmer(ws.getDictionary());
System.out.println("test" + stem.findStems("reading") );
于 2012-10-16T17:38:23.570 に答える