私はこのコードを持っていますが、それをより速く行う組み込みの方法があるかどうか疑問に思っていましたか?
Words には、単純なトークン化された文字列入力があります。
freq_unigrams = nltk.FreqDist(words)
unigram_list = []
count = 0
for x in freq_unigrams.keys():
unigram_list.append(x)
count+=1
if count >= 1000:
break