以下は、1 つの Python スクリプトの出力です。
{ 12: {'@': False, '#': False, 'word': 'good#1st#time#will', 'longword': True, 'title': False, 'charcount': 18, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 12: {'@': False, '#': False, 'word': 'be', 'longword': False, 'title': False, 'charcount': 2, 'uppercase': False, 'stop': True, 'sscore': False, 'url': False, '!!!': False} }
{ 12: {'@': False, '#': False, 'word': 'going', 'longword': False, 'title': False, 'charcount': 5, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 13: {'@': False, '#': False, 'word': 'back#', 'longword': False, 'title': False, 'charcount': 5, 'uppercase': False, 'stop': False, 'sscore': False, 'url': False, '!!!': False} }
{ 13: {'@': False, '#': False, 'word': 'http://instagr.am/p/rx9939civ8/\xc2\xa0', 'longword': True, 'title': False, 'charcount': 33, 'uppercase': False, 'stop': False, 'sscore': False, 'url': True, '!!!': False} }
別の python スクリプトでは、上記が入力として使用されます。上記のコードはすべて、1 つのスクリプトの出力であるさまざまな辞書ですが、別のスクリプトでは、「charcount」の合計または longword=True のカウント数を実行したいのですが、これらの複数の辞書が同一のキーを持つため、出力は次のようになります。
{ 12: {'longword': 1 ,'charcount': 25} }
{ 13: {'longword': 1 ,'charcount': 38} }
私のデータセットはそれらをグループ化しませんが、12 をキーとして、13 をキーとして単一の辞書を出力します。大きなデータセットがあり、上記の集計を行うため、コードはすべての同一のキーを見つけることができるはず
です。これは、上記を複数辞書として使用するコードですが、集計を行う方法がわかりません。
dicts = {}
for line in sys.stdin:
d = ast.literal_eval(line)
for k,v in d.items():
dicts.setdefault(k, []).append(v)
for key,val in v.items():
これは私がこれまでに持っているコードです。