NLTK Word Net Lemmatizer を使用して、リスト ( textという名前) 内の単語を見出し語化するより高速な方法を見つけようとしています。どうやらこれは私のプログラム全体で最も時間のかかるステップです(cProfilerを使用して同じものを見つけました)。
以下は、速度を最適化しようとしているコードです-
def lemmed(text):
l = len(text)
i = 0
wnl = WordNetLemmatizer()
while (i<l):
text[i] = wnl.lemmatize(text[i])
i = i + 1
return text
レマタイザーを使用すると、パフォーマンスが 20 分の 1 に低下します。どんな助けでも大歓迎です。