幹('りんご')='りんご'
幹('りんご')='アプリ'
幹('アプリ')='アプリ'
これはステミング アルゴリズムの欠陥ではありませんか?
(これはPorter Stemming Algorithmを使用しています)
幹('りんご')='りんご'
幹('りんご')='アプリ'
幹('アプリ')='アプリ'
これはステミング アルゴリズムの欠陥ではありませんか?
(これはPorter Stemming Algorithmを使用しています)
これは、使用しているアルゴリズムの実装のバグのように見えます。
(リンク先のページから)元のアルゴリズムの手順に従うと、「りんご」の最後の「s」は手順 1a で削除され、「e」は手順 5a で削除されるため、「りんご」の語幹は次のようになります。また、「appl」。
http://preciselyconcise.com/apis_and_installations/smart_stemmer.phpで辞書をサポートするポーター ステミング アルゴリズムの実装を見つけました。
この API は非常に使いやすく、語幹が付けられた単語のスペルミスが修正されました。この API にはステミングされた単語の自動修正オプションがあるため、このステマーを使用することをお勧めします。