私は現在、派生語を識別するために PorterStemmer を使用しています。しかし、同じ意味を持っていないように見える単語の問題に直面しています。例:
Market
and Marketing
Wine
and Winning
etc..
は意味が異なりますが、PorterStemmer はそれらを同じものとして識別します。
このような問題を解決できるオープン ツールはどれですか? コーナーケース付きの辞書?より高度なステマー?
できれば、PHP から簡単にアクセスできるもの。