Pavel Anossov のおかげで、これが私が今持っているものです。出力された単語頻度をアスタリスクに変換しようとしています。
import sys
import operator
from collections import Counter
def candidateWord():
with open("sample.txt", 'r') as f:
text = f.read()
words = [w.strip('!,.?1234567890-=@#$%^&*()_+')for w in text.lower().split()]
#word_count[words] = word_count.get(words,0) + 1
counter = Counter(words)
print("\n".join("{} {}".format(*p) for p in counter.most_common()))
candidateWord()
これは私が現在出力として持っているものです。
how 3
i 2
am 2
are 2
you 2
good 1
hbjkdfd 1
私が試して使用したい式は、最も頻繁に発生する単語が M 回発生し、現在の単語が N 回発生する場合、出力されるアスタリスクの数は次のとおりです。
(50 * N) / M