が必要です-のは以前と同じです:transform
size
len
df
知らせ:
ここでは、 の後に 1 列を追加する必要groupby
があります。そうしないと、エラーが発生します。GroupBy.size
countも同様であるためNaN
、どの列が使用されるかは重要ではありません。すべての列が同じように機能します。
import pandas as pd
df = pd.DataFrame({'A': ['x', 'x', 'x','y','y']
, 'B': ['a', 'c', 'c','b','b']})
print (df)
A B
0 x a
1 x c
2 x c
3 y b
4 y b
df['size'] = df.groupby(['A', 'B'])['A'].transform('size')
print (df)
A B size
0 x a 1
1 x c 2
2 x c 2
3 y b 2
4 y b 2
集計で列名を設定する必要がある場合df
- len
ofdf
は明らかに以前と同じではありません:
import pandas as pd
df = pd.DataFrame({'A': ['x', 'x', 'x','y','y']
, 'B': ['a', 'c', 'c','b','b']})
print (df)
A B
0 x a
1 x c
2 x c
3 y b
4 y b
df = df.groupby(['A', 'B']).size().reset_index(name='Size')
print (df)
A B Size
0 x a 1
1 x c 2
2 y b 2