次のようなデータフレームがあります。
tt oo
0 g gh
1 g jj
2 g gh
3 t gh
4 t gh
「tt」で集計し、「oo」列の数を次のようにカウントする新しいデータフレームを作成したいと思います。
gh jj
g 2 1
t 2 0
ピボット テーブルを試してみましたが、「インデックスに重複したエントリが含まれています」というエラーが表示されました。t
dfrm1 = pandas.DataFrame({'tt':['g', 'g', 'g', 't', 't'],
'oo':['gh', 'jj', 'gh', 'gh', 'gh']})
dfrm1.groupby('tt')['oo'].value_counts().unstack(level=1).fillna(0.0)
次を使用して、これを1行で実行できますgroupby
。
df.groupby('tt')['oo'].value_counts()
Out[8]:
tt
g gh 2
jj 1
t gh 2
dtype: int64