ファイルを読んで、最も頻繁に使用される単語を見つけたいです。以下はコードです。ファイルを読んでいると思いますが、間違いを犯しています。任意の提案をいただければ幸いです。
txt_file = open('result.txt', 'r')
for line in txt_file:
for word in line.strip().split():
word = word.strip(punctuation).lower()
all_words = nltk.FreqDist(word for word in word.words())
top_words = set(all_words.keys()[:300])
print top_words
入力結果.txtファイル
Musik to shiyuki miyama opa samba japan obi Musik Musik Musik
Antiques antique 1900 s sewing pattern pictorial review size Musik 36 bust 1910 s ladies waist bust