これが私のpythonコードです:
import spacy
nlp = spacy.load('en')
line = u'Algorithms; Deterministic algorithms; Adaptive algorithms; Something...'
line = line.lower()
print ' '.join([token.lemma_ for token in nlp(line)])
出力は次のとおりです。
algorithm ; deterministic algorithm ; adaptive algorithms ; something...
algorithms
3番目が「アルゴリズム」に変換されないのはなぜですか? 関数を削除lower()
すると、次のようになります。
algorithms ; deterministic algorithms ; adaptive algorithm ; something...
今回は1回目と2回目algorithms
が変換できませんでした。この問題は私を夢中にさせます。これを修正して、すべての単語を見出し語化するにはどうすればよいですか?