0

Lucene.NET の実装を開始しようとしていますが、PorterStemFilter. ここを読んでソースコードを読むと、私のニーズにはあまりにも積極的すぎるようです.

ルートを探すのではなく、「er」、「ed」、「s」などのサフィックスを削除するだけの、より単純なものが必要です。私が読んだことから、KStem はそのトリックを行うでしょう。

私は一生、KStem の .NET バージョンを見つけることができません。ポートをハンドロールするための Java バージョンのソース コードすら見つかりません。

誰かが私を正しい方向に向けることができますか?

不要なステップを削除するだけで、削減された PorterStemmer を手作りするのは簡単なようです。誰でもそれで成功していますか?

4

1 に答える 1

0

contrib の一部であるHunspellStemmerを使用できます。自由に利用できる hunspell 辞書を使用して、適切なステミングを提供できます。

于 2013-05-04T12:30:40.017 に答える