2

次のファイルに似たデータセットがあります

2013-05-30 06:00:41    173.199.116.171
2013-05-30 06:05:41    61.245.172.14
2013-05-30 06:10:42    74.86.158.106
2013-05-30 06:20:42    61.245.172.14

20 分間再サンプリングして、特定の 20 分間のタイム スロットのヒット カウントを取得したい (例: (06.00.00-06.20.00 または 06.40.00-07.00.00 など))。ヒット カウントを出力できます。データファイル全体は次のようになります。

ips = df.groupby('IP').size()

20 分のスロットごとにヒット カウントを取得する方法は?次のコードは、'06:00:00' と '06:20:00' の間のすべての IP を出力するだけです。

df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')
4

2 に答える 2