Porter Stemmer Algorithm について質問があります。インターネットで調べたのですが、
しかし、アンダーステミングとオーバーステミングの違いがわかりませんでした。
Porter Algorithm はアンダーステミングまたはオーバースタミングですか?
アイデアはありますか?
前もって感謝します
Porter Stemmer Algorithm について質問があります。インターネットで調べたのですが、
しかし、アンダーステミングとオーバーステミングの違いがわかりませんでした。
Porter Algorithm はアンダーステミングまたはオーバースタミングですか?
アイデアはありますか?
前もって感謝します
カットオフ接尾辞が長すぎると、オーバーステミングが発生します。これにより、無関係な単語が誤って一致することになります。
アンダーステムはその逆です。たとえば、本質的にアンダーステムを切断しないステマーなどです。
Porter Stemmerは、英語の場合、両方のタイプのエラーを時々実行すると思います。他の言語の実装は非常に異なる動作をする可能性があることに注意してください(多数の言語に対してユーザーが提供するアルゴリズムを備えたSnowballについて言えば)。それらは、語幹の言語学的定義においてさえ異なる場合があります。