グループサイズの「カウント」に一貫性がないのはなぜですか?
私はPandas10.0を使用しており、600万行のデータセットが400kグループに削減されています。
In [16]: df.groupby('Z ID').size()[470009:470010]
Out[16]:
Z ID
994555 6
In [14]: df[df['Z ID'] == 994555].groupby('Z ID').size()
Out[14]:
Z ID
994555 9
生データを確認したところ、9項目あります。
編集:生データ 完全なデータセットは600万レコードです。パンダsize()は小さな男に最適です。
FilterDate Z ID AR Code AA Code
48349 12/1/2007..2/28/2009 994555 377 202
151060 2/1/2008..4/30/2009 994555 377 202
204179 3/1/2008..5/31/2009 994555 377 202
244504 4/1/2008..6/30/2009 994555 377 202
302728 5/1/2008..7/31/2009 994555 377 202
365780 6/1/2008..8/31/2009 994555 377 202
431555 7/1/2008..9/30/2009 994555 377 202
499234 8/1/2008..10/31/2009 994555 377 202
786937 12/1/2008..2/28/2010 994555 377 202