2

幹('りんご')='りんご'
幹('りんご')='アプリ'
幹('アプリ')='アプリ'

これはステミング アルゴリズムの欠陥ではありませんか?

(これはPorter Stemming Algorithmを使用しています)

4

2 に答える 2

1

これは、使用しているアルゴリズムの実装のバグのように見えます。

(リンク先のページから)元のアルゴリズムの手順に従うと、「りんご」の最後の「s」は手順 1a で削除され、「e」は手順 5a で削除されるため、「りんご」の語幹は次のようになります。また、「appl」。

于 2009-09-01T23:24:35.040 に答える
0

http://preciselyconcise.com/apis_and_installations/smart_stemmer.phpで辞書をサポートするポーター ステミング アルゴリズムの実装を見つけました。

この API は非常に使いやすく、語幹が付けられた単語のスペルミスが修正されました。この API にはステミングされた単語の自動修正オプションがあるため、このステマーを使用することをお勧めします。

于 2014-05-11T14:14:32.287 に答える