FreqDist (つまり、NLTK 度数分布) の値を二乗し、すべての二乗を合計する Python 2.7 コードがあります。
たとえば、次のようになります: 2*2 + 1*1 + 1*1 + 1*1 = 7
これは私にとってはうまくいきますが、これよりも「より良い」方法があるかどうか疑問に思っていました:
for word, frequency in t.freq_dist.iteritems():
total += frequency*frequency
他の何かのために freq_dist をもう一度ループする必要があるため、私は尋ねています。このコードの直後なので、より良い方法があれば、2回ループするのは良い習慣ではないと思いました...