PHPのレンマタイザーを知っている人はいますか? または、最悪の場合、PHP webapp で別の言語 (python NLTK など) でレンマタイザーを使用する方法はありますか?
私はマクロ語源アナライザーを構築していますが、語源データベースに共役語が含まれていないというこの問題に遭遇しました。レマタイザーは、辞書が「said」を見つけられないときに「say」という単語を与え、辞書が「better」を見つけられないときに「good」を返すなどして、これを修正すると思います。
注: ステマーは、レンマタイザーと同じことはしません。