-3

この種のことを達成する必要がある簡単なプロジェクトがあります。

Sports - > Sport
Walking -> Walk

and ideally also do things like:

good -> better
better -> good 
person -> people
people -> person

誰かがこれを達成できる最も軽い方法のライブラリを教えてもらえますか? (Lucene、CoreNLP などの lib があることは知っています。)しかし、これらは非常に重いので、ステマー/レンマタイザーが必要なだけです。

ありがとうございました!

4

1 に答える 1

2

粗い結果 ( updates->updatなど) で問題がなく、重みが重要な場合は、ステミングを使用します。Snowball、Mg4jなどのステミングといくつかのオプションの提供に関する質問をご覧ください。JWIの一部としてWordNetステマーもあります。

より洗練された結果が必要な場合は、見出し語化に対処する必要があります。これには、いくつかのライブラリもあります: Stanford CoreNLP (実際にはそれほど複雑ではありません) またはWordNet に基づくCICWN

于 2015-04-16T10:49:40.107 に答える