-2

Java API を使用してトークナイザーを構築しようとしています (スタンフォード、Apache OpenNLP が提供するものは使用しません)。正規表現と Java パターン/マッチャーを使用して、単語を分離することができました。

"[a-zA-Z]+".

私は今、単語の補題を見つけたいと思っています。ライセンスの問題があるため、StanfordNLP を使用したくありません。次は何?参照/比較するモデルとして辞書が必要だと思います。と ...?誰かがそれをしたことがありますか?Java を使用して単語レンマタイザーを構築しようとしていますか? 前もって感謝します。:)

4

1 に答える 1