私は Java でアプリを操作しており、Lucene 4.1.0 を使用して Porter Stemmer メソッドを使用しています。私はこれを読んで実装しました
これは私のコードです
import org.apache.lucene.analysis.snowball.*;
import org.tartarus.snowball.ext.PorterStemmer;
private String stemmer(String word){
PorterStemmer obj = new PorterStemmer();
obj.setCurrent(word);
obj.stem();
return obj.getCurrent();
}
この方法は機能しますが、Porter Stemmer はいくつかの単語に対して適切に機能しませんでした。
- ソース >> ソース
- 結合 >> 結合
- 同行 >> 同行
多分アルゴリズムにバグがありますか?この問題を解決するには?