データ フレーム:
pair = collections.defaultdict(collections.Counter)
例えば
pair = {'doc1': {'word1':4, 'word2':3},
'doc2': {'word1':2, 'word3':4},
'doc3': {'word2':2, 'word4':1},
...}
データ フレームを保持したいが、このパーツのタイプを変更する{'word1':4, 'word2':3}
{'word1':2, 'word3':4}``...
現在はCounter
であり、 が必要dict
です。
からデータを取得するためにこれを試しましたが、 for each docpair
を作成する方法がわかりません:dict
new_pair = collections.defaultdict(collections.Counter)
for doc, tab in testing.form.items():
for word, freq in tab.items():
new_pair[doc][word] = freq
出力を変更したくありません。各ドキュメントで必要なのは、データ型がではなく であることだけです。dict
Counter