私は R でウェブログ ファイルの分析を行おうとしていました。数値データが存在する場合はいつでも日付とバイトを処理できますが、文字列を処理できません。
ログ ファイル (CSV 形式のログ ファイル) から、特定のユーザー (IP とエージェントの助けを借りて) とその Web ページでの合計支出を調べたいと考えています。
私は R でウェブログ ファイルの分析を行おうとしていました。数値データが存在する場合はいつでも日付とバイトを処理できますが、文字列を処理できません。
ログ ファイル (CSV 形式のログ ファイル) から、特定のユーザー (IP とエージェントの助けを借りて) とその Web ページでの合計支出を調べたいと考えています。
この種の分析を行うためのライブラリは数多くありますが、R には何も見つかりませんparse apache logfile
でした。どちらも、ファイルの内容を解析するために正規表現に依存しています。python parse apache logfile
ここから、Apache ログファイルを処理するには 2 つの方法があります。
あなたはcsvファイルを参照していますが、上記のライブラリはApacheログを含む元のテキストファイルで動作すると思うので、csvファイルではなくそれらを使用します.
さらに、この SO 投稿では、@doug ( profile ) による回答に言及しており、Python によって解析された apache ログファイル データの視覚化を作成する関数をいくつか作成したと述べています。彼にメッセージまたはメールを送って、コードを共有する意思があるかどうかを確認してみてください。
R でのログファイル分析は、以前に取り上げた興味深いトピックです。ここで議論を見つけることができます。おそらく、この議論は、より良いフィードバックを得るために、SO のエチケットに順応するのにも役立つかもしれません (ポール、あなたから何かを奪うことはありません)。