apache - error.log に記載されている欠落ファイル

Question

今日、Web ホストで「error.log」というフォルダーを見つけました。見てみようと思いました。

「ファイルが存在しません」というエラーが複数表示されます。エントリには次の 3 種類があります。

robots.txt
行方不明.html
apple-touch-icon-precomposed.png

これらのファイルが何に使用されているかについていくつか推測がありますが、明確に知りたいです:

問題のファイルは何ですか?
それらをサーバーに追加する必要がありますか?
これらのエラーログが書き込まれるように促すものは何ですか? 明示的に要求している人ですか？もしそうなら、誰が、どのように？

score 2 · Accepted Answer

ファイルは Web クローラー/ロボットrobots.txtによって読み取られ、サーバー上のリソースのスクレイピングを許可/禁止します。ただし、ロボットがこのファイルを読み取ることは必須ではありませんが、優れたロボットは読み取ります。http://en.wikipedia.org/wiki/Robots.txtにさらにいくつかの例があります。サンプルファイルは次のようになり、Web ルートディレクトリに存在します。

User-agent: *   # All robots
Disallow: /     # Do not enter website

また

User-Agent: googlebot   # For this robot
Disallow: /something    # do not enter

apple-touch-icon-precomposed.png説明されていますhttps://stackoverflow.com/a/12683605/722238

の使用法はmissing.html、カスタマイズされた 404 ページとして一部で使用されていると思います。ロボットがこのファイルをスクレイピングするように構成されている可能性があるため、このファイルが要求されます。

ロボットがサーバーから取得するリソースを制御する場合は、robots.txt ファイルを追加する必要があります。前に述べたように、ロボットがこのファイルを読み取ることは必須ではありません。

ただし、他の 2 つのファイルを追加してエラーメッセージを削除することもできますが、その必要はないと思います。joe_random がサーバーにリクエストを送信しないことは言うまでもあり/somerandomfile.txtません。その場合、存在しない別のファイルに関する別のエラーメッセージが表示されます。その後、カスタマイズした 404 ページにリダイレクトできます。

apache - error.log に記載されている欠落ファイル

1 に答える 1

Related

Reference