アクセスログファイルを表現しようとしています。これを行うには、アクセスログファイルを1行ずつ読み取り、各行から有用な情報を抽出し、最終的にそれらをデータベースに追加します。
たとえば、行は次のようになります。
124.99.152.202 - naveen [22/Nov/2013:10:41:17 +1300] "GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078/IneedThisInteger/12.txt HTTP/1.1" "200" "3" "-" "Mozilla/5.0" "-"
IPアドレスを抽出する方法しか知りません(これを使用)
抽出したい
このリクエスト値-
GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078,IneedThisInteger/12.txt HTTP/1.1
上記の部分からのこの整数値-
IneedThisInteger
このステータス部分-
200
このバイト部分-
3
リクエスト URL の最後の部分が変更されることがあります。
"GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078,IneedThisInteger/FOLDER/12.txt HTTP/1.1"
"GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078,IneedThisInteger/FOLDER/ANOTHER FOLDER/12.txt HTTP/1.1"
"GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078,IneedThisInteger/FOLDER/ANOTHER FOLDER/HEREIS-ANOTHER-FOLDER-AND-SO-ON/12.txt HTTP/1.1"
したがって、各行からこれらの値を取得するための安定した方法が本当に必要です。どうすればよいですか?