現在、自分の Web ページのすべてのアクティビティを、ファイル access.log にある nginx Web サーバーに記録しています。このファイルはその形式のために理解できません。これらのログ ファイルを Hadoop Hive にエクスポートして分析したいと考えています。ただし、Hive は生の nginx ログを理解できません。したがって、これらのログを JSON または CSV 形式に再生成し、その後、ログをクエリおよび分析できるハイブにエクスポートする予定です。上記の作業を可能にするツール/方法をいくつか提案してください。現在、nginx のログは次のようになっています。
115.249.242.17 - - [01/Jun/2012:18:44:57 +0530] "GET /flashlayer?videoId=66127&playSessionId=VOD_66127_e04393db-0b40-44b1-aad8-aa2169ac71a710.32.6.1311338556485611&duration=0&playerState=playing&playerError=null HTTP/1.1" 200 86 "-" "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:12.0) Gecko/20100101 Firefox/12.0"