これを投稿するのを少しためらっています-私に関する限り、それは本物の質問ですが、それが批判されているか、議論の招待であるとして閉鎖されているかどうかは理解できると思います...
とにかく、特定のイベントの非常に大きな Web ログを検索するには、Python を使用する必要があります。正規表現は良いでしょうが、私は特定のアプローチに縛られていません.GETリクエストのどこにでも現れる可能性のある2つの文字列を含む行が欲しいだけです.
典型的なファイルは 400 MB を超え、約 100 万行を含むため、完了までの時間とサーバー (ubuntu/nginx VM - かなり適切に仕様が定められており、過負荷になることはめったにありません) へのロードの両方の点でパフォーマンスが問題になる可能性があります。
私はかなり最近 Python に変換しました (かなり初心者ですが、まだ学ぶべきことがたくさんあることに注意してください)。これを達成するための最良の方法について少しガイダンスが欲しいです。
開いて繰り返しますか? 新しいファイルに grep してから開きますか? 2つのいくつかの組み合わせ?他の何か?