1

私は R でウェブログ ファイルの分析を行おうとしていました。数値データが存在する場合はいつでも日付とバイトを処理できますが、文字列を処理できません。

ログ ファイル (CSV 形式のログ ファイル) から、特定のユーザー (IP とエージェントの助けを借りて) とその Web ページでの合計支出を調べたいと考えています。

4

2 に答える 2

2

この種の分析を行うためのライブラリは数多くありますが、R には何も見つかりませparse apache logfileでした。どちらも、ファイルの内容を解析するために正規表現に依存しています。python parse apache logfile

ここから、Apache ログファイルを処理するには 2 つの方法があります。

  • ダイレクト リンクまたはシステム コールを使用して、R から perl または python を呼び出します (こちらの方が簡単です)。
  • perl または python lib からアイデアを取り入れ、それを使用して関数の R バージョンを実装します。これには多くの時間がかかります。

あなたはcsvファイルを参照していますが、上記のライブラリはApacheログを含む元のテキストファイルで動作すると思うので、csvファイルではなくそれらを使用します.

さらに、この SO 投稿では、@doug ( profile ) による回答に言及しており、Python によって解析された apache ログファイル データの視覚化を作成する関数をいくつか作成したと述べています。彼にメッセージまたはメールを送って、コードを共有する意思があるかどうかを確認してみてください。

于 2012-09-22T18:04:29.520 に答える
0

R でのログファイル分析は、以前に取り上げた興味深いトピックです。ここで議論を見つけることができます。おそらく、この議論は、より良いフィードバックを得るために、SO のエチケットに順応するのにも役立つかもしれません (ポール、あなたから何かを奪うことはありません)。

于 2012-10-08T09:10:05.030 に答える