現在、Java プロジェクトで Snowball Stemmer (Porter2) を使用して語幹処理を行っています。たとえば、online -> onlin
、why -> whi
、raise-> rais
、appreciate -> appreci
。
これらを回避する何らかの辞書を実装することにより、意味のある単語を取得したいのでtreating -> treat
、この不要なステミングを防ぐ方法はありますか?単語が語幹処理されていますか? または、Snowball に似た他のステマーで、ステミング能力の精度が低い場合はありますか?records -> record
development -> develop
すべての助けをありがとう。
これが私の機能です。