2

FreqDistのfd.items()を使用して単語の頻度を合計するにはどうすればよいですか?

>>> fd = FreqDist(text) 
>>> most_freq_w = fd.keys()[:10] #gives me the most 10 frequent words in the text
>>> #here I should sum up numbers of each of these 10 freq words appear in the text

たとえば、の各単語most_freq_wが10回出現する場合、結果は次のようになります。100

!!! テキスト内のすべての単語の数は必要ありません。最も頻繁に使用されるのは10語だけです。

4

4 に答える 4

4

私は に慣れていませんnltkが、 からFreqDist派生してdictいるため、次のように動作するはずです:

v = fd.values()
v.sort()
count = sum(v[-10:])
于 2010-11-17T17:28:52.680 に答える
0

FreqDist単語をその頻度にマッピングした場合:

sum(map(fd.get, most_freq_w))
于 2010-11-17T18:58:11.550 に答える