Lucene.NET の実装を開始しようとしていますが、PorterStemFilter
. ここを読んでソースコードを読むと、私のニーズにはあまりにも積極的すぎるようです.
ルートを探すのではなく、「er」、「ed」、「s」などのサフィックスを削除するだけの、より単純なものが必要です。私が読んだことから、KStem はそのトリックを行うでしょう。
私は一生、KStem の .NET バージョンを見つけることができません。ポートをハンドロールするための Java バージョンのソース コードすら見つかりません。
誰かが私を正しい方向に向けることができますか?
不要なステップを削除するだけで、削減された PorterStemmer を手作りするのは簡単なようです。誰でもそれで成功していますか?