一部のデータに対して集計を実行したいのですが、完了したら、集計を集計を構成した行にリンクして戻します。
df = pd.DataFrame({"vehicle": ['car','bus','bus' ,'car','bus'],
"colour" : ['red','red','blue','red','blue'],
"weight" : [ 1, 14, 10, 2, 12]
})
grouped = df.groupby(["vehicle", "colour"], as_index=False)
print grouped.agg({"weight":"sum"})
vehicle colour weight
0 bus blue 22
1 bus red 14
2 car red 3
集計を表示したい場合、上記の集計データを反復処理できます。ただし、特定の集計を構成する行を決定/表示できるようにしたいと考えています。つまり、赤い車の集合体が元のデータ セットの行 0 と行 3 で構成されていることを効率的に判断できる必要があります。
最終的には、この関係をファイルに保持したいと考えていますが、これが 1 つの結合されたデータセットで達成できるかどうか、または 2 つの別個のデータ セットが必要かどうかはわかりません。元のデータの行
私の主な質問は、元のデータセットの行 0 と 3 で構成される赤い車 = 3 をどのように決定するかです。
助けてくれてありがとう、マーカス