Apache ログ ファイルを定期的に解析して、訪問者や帯域幅の使用状況などを記録するプログラムを作成しています。
問題は、ログを開いて、既に解析したデータを解析したくないということです。例えば:
line1
line2
line3
そのファイルを解析すると、すべての行を保存してから、そのオフセットを保存します。そうすれば、もう一度解析すると、次のようになります。
line1
line2
line3 - The log will open from this point
line4
line5
2 回目は、line4 と line5 を取得します。うまくいけば、これは理にかなっています...
私が知る必要があるのは、どうすればこれを達成できるかということです。Python には、オフセットを指定する seek() 関数があります...ログを解析した後にファイルサイズ (バイト単位) を取得し、それを 2 回目にログに記録するときに (seek() で) オフセットとして使用しますか?
これをコーディングする方法が思い浮かびません >.<