2

以下を実行しました。

from nltk import WordNetLemmatizer as wnl
wnl().lemmatize("American")
wnl().lemmatize("Americans")

どちらも引数を返すだけです。アメリカ人をアメリカ人に減らしてほしい。これを実現する方法を知っている人はいますか?

レマタイザーが使用している内部辞書を変更する必要があると思いました。これは正しいです?誰もがより良い方法を知っていますか?

ありがとう!

4

2 に答える 2

5

WordNet では大文字と小文字が区別されるようですが、PorterStemmer も使用できます。

>>> wnl().lemmatize('americans')
'american'
>>> from nltk.stem import PorterStemmer as ps
>>> ps().stem('Americans')
'American'
于 2011-11-04T01:41:05.107 に答える