3

数週間前にサーバーのディレクトリ構造を変更した後、Facebook ボットから多くの 403 および 404 エラーが発生しています。もちろん、キャッシュがクリアされるまで、このような状況ではこのようなエラーが発生することが予想されますが、ほとんどの場合、そのようなエラーが発生しています。ただし、選択した共有リンクのグループでこのエラーが引き続き発生します。対応するページのデバッグ ツールを使用してキャッシュをクリアすることを繰り返し試みました。(lint ツール: lint ツールの URL )。私のログからのいくつかの例を次に示します。

HTTP アクセス ログ:

69.171.224.251 - - 443 [13/Jan/2012:06:22:01 -0500] "GET /web/user/images/b0/b0ahhSjq1C1oEX0TBS5gLAmcSX4wKdPT.240.jpg HTTP/1.1" 403 338

そしてhttpエラーログ:

[Fri Jan 13 05:55:01 2012] [error] [client 69.171.228.249] File does not exist: /var/xxx/www/html/web/user/images/1/ab/abSIktLHDs3rcUPYyFtxsP8J9u7vvaVr.240.jpg

これらの IP アドレスは facebook を指しています。

おそらく私は間違ったURLをlintしていますか?これらのリクエストが属する URL を確認するにはどうすればよいですか? Facebook はある時点で要求を停止し、キャッシュを更新しませんか? 上記の 2 番目のエラーは、先週、1 日に約 25 回繰り返されました。

(この時点では、URL の書き換えは考えていません。)

4

1 に答える 1

0

301の永続的なリダイレクトを設定する必要があります。または、ある種のURL書き換えを行います。どちらの方法でも機能します。

また、レポートがリンター/スクレーパーのユーザーエージェントを除外していることを確認することもできます

Facebookはいつ私のページをこすりますか?

Facebookは、サイトの周囲にページを表示する方法を知るために、ページをスクレイプする必要があります。

Facebookは、プロパティが最新であることを確認するために、24時間ごとにページをスクレイプします。Open Graphページの管理者が「いいね」ボタンをクリックしたとき、およびURLがFacebook URL Linterに入力されたときにも、ページはスクレイプされます。Facebookは、URLのキャッシュヘッダーを監視します。優先順位に従って「Expires」と「Cache-Control」を確認します。ただし、より長い時間を指定しても、Facebookは24時間ごとにページをスクレイプします。

スクレーパーのユーザーエージェントは、「facebookexternalhit / 1.1(+ http://www.facebook.com/externalhit_uatext.php)」です。

于 2012-01-14T01:07:06.780 に答える