35

列の一意のペア (ip、useragent) ごとに行数でカウントする方法を理解しようとしています。

d = pd.DataFrame({'ip': ['192.168.0.1', '192.168.0.1', '192.168.0.1', '192.168.0.2'], 'useragent': ['a', 'a', 'b', 'b']})

     ip              useragent
0    192.168.0.1     a
1    192.168.0.1     a
2    192.168.0.1     b
3    192.168.0.2     b

生産するには:

ip           useragent  
192.168.0.1  a           2
192.168.0.1  b           1
192.168.0.2  b           1

アイデア?

4

2 に答える 2

61

groupby を使用すると、必要なものが得られます。

d.groupby(['ip', 'useragent']).size()

生成:

ip          useragent               
192.168.0.1 a           2
            b           1
192.168.0.2 b           1
于 2012-12-01T13:34:16.033 に答える