次のファイルに似たデータセットがあります
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
20 分間再サンプリングして、特定の 20 分間のタイム スロットのヒット カウントを取得したい (例: (06.00.00-06.20.00 または 06.40.00-07.00.00 など))。ヒット カウントを出力できます。データファイル全体は次のようになります。
ips = df.groupby('IP').size()
20 分のスロットごとにヒット カウントを取得する方法は?次のコードは、'06:00:00' と '06:20:00' の間のすべての IP を出力するだけです。
df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')