無料のウェブサイト サイトマップ アプリケーションを開発しています。
Web サーバーのログ ファイルに書き込まれる、要求された URL の形式を教えてください。
Web サイトのさまざまなページを抽出するために、これらのログ ファイルを解析したいと考えています。
各行の形式は常に「GET /mywebpage.html」ですか? ありがとうございました !
無料のウェブサイト サイトマップ アプリケーションを開発しています。
Web サーバーのログ ファイルに書き込まれる、要求された URL の形式を教えてください。
Web サイトのさまざまなページを抽出するために、これらのログ ファイルを解析したいと考えています。
各行の形式は常に「GET /mywebpage.html」ですか? ありがとうございました !
常に同じというわけではありません。デフォルトはサーバーによって異なり、構成可能です。たとえば、Apache では、 config にCustomLogディレクティブを設定できます。これにより、ログに記録される情報、ログに記録される順序、およびログに記録されるファイルを完全にカスタマイズできます。
最も一般的な形式はApache CLF (Common Log Format または Combined Log Format) です。
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined
より良い回答を得るには、使用中の Web サーバーを指定するか、少なくともログのサンプル行を表示する必要があります。