5

pandas データ フレームを使用してデータを集計しました。以下は、表示されている実際のデータと、それをどのように集計したかです。

fdf.groupby(['row',col'])['percent'].sum()

http://pastebin.com/R8XWpgtU

私がやりたいのは、これの 2 次元の numpy 配列を作成することです (行 = 行、列 = 列)。これを行うための巧妙な方法はありますか?

私が同様のことをした別の方法は、ピボットテーブルを作成することでした

pivot_table(fdf,values='percent',rows='row',cols='col', aggfunc=np.sum)

この場合、このピボット テーブルを 2D numpy 配列に変換します。このテーブルの各セルにインデックスを付ける方法はありますか? もしそうなら、私はおそらくテーブル自体で大丈夫でしょう.

4

1 に答える 1

6

試す:

result = fdf.groupby(['row',col'])['percent'].sum()
result.unstack('col').values

別の方法:

fdf.pivot_table('percent', rows='row', cols='col', aggfunc='sum').values
于 2012-04-18T21:50:13.353 に答える