Apache のアクセス ログ ファイルを分析していて、ヒット数を知りたいです。
次のコードはそれを行います。
ips = df.groupby('IP').size()
ips.sort()
print ips[-10:]
しかし、トップ10の「リファラー」(9列目)を見つけたいですips
。
これどうやってするの?
ログ ファイルの行の例:
112.135.128.20 - [13/May/2013:23:55:04 +0530] "GET /SVRClientWeb/ActionController HTTP/1.1" 302 2 "https://www.example.com/sample" "Mozilla/5.0 (iPhone; CPU iPhone OS 6_1_3 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Mobile/10B329" GET /SVRClientWeb/ActionController - HTTP/1.1 www.test.com