java - JWI と Wordnet で語幹を取得する

Question

単語の語幹を取得するために、MIT の JWI (Java API for WordNet) に実装されているステマーメソッドを正しく使用するにはどうすればよいですか? ステマーを初期化して findStems メソッドを使用する方法がわかりません。

score 6 · Accepted Answer

追加のライブラリは必要ありませんが、辞書は必要です。プリンストンからダウンロードできます: https://wordnet.princeton.edu/wordnet/download/current-version/

「WordNet 3.1 データベースファイルのみ」のセクションから辞書のみをダウンロードして、アーカイブを展開することをお勧めします。PATH/dict が出力の場所であると仮定すると、次のコードを使用できます。

Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);

List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
    System.out.println(test.get(i));
}

この例の出力は「foot」です。

score 1 · Accepted Answer

これは、sakthi の回答に対するコメントを意味します。実際には、メソッドを呼び出すときに、探している POS (名詞、形容詞、動詞など) を正確に指定する必要がありますfindStems(JWI v2.2.3): http://projects.csail .mit.edu/jwi/api/edu/mit/jwi/morph/IStemmer.html

score 0 · Accepted Answer

使用される jar ファイルは、edu.mit.jwi_2.1.4.jar および edu.sussex.nlp.jws.beta.11.jar です。

JWS ws = new JWS("C:/Program Files/WordNet","2.1");  
WordnetStemmer stem =  new WordnetStemmer(ws.getDictionary());
System.out.println("test" + stem.findStems("reading") );

java - JWI と Wordnet で語幹を取得する

3 に答える 3

Related

Reference