10

私たちは URL 短縮サービスを運用しており、先週かそこらで{normal url}/no_facebook_preview_picture.jpg、Facebook が所有する IP とユーザー エージェントからの多くの奇妙なリクエストを目にするようになりました。facebookexternalhit/1.0 (+http://www.facebook.com/externalhit_uatext.php)

サイトへの通常のリンクをウォールに投稿すると (Only Meテストできるように設定)、アクセス ログに次のエントリが記録されます。

66.220.152.6 - - [05/Feb/2013:16:31:36 +0000] "GET /44_U HTTP/1.1" 200 1314 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "-"

ただし、404 または 410 を返すリンク (スパム リンクは作成後に削除されます) を投稿すると、次のようになります。

69.171.237.15 - - [05/Feb/2013:16:49:16 +0000] "GET /notexistURL HTTP/1.1" 404 1319 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "-"

その後、1時間以内に

173.252.110.113 - - [05/Feb/2013:17:15:15 +0000] "GET /notexistURL/no_facebook_preview_picture.jpg HTTP/1.1" 404 0 "-" "facebookexternalhit/1.0 (+http://www.facebook.com/externalhit_uatext.php)" "-"

その IP レポートの WhoIs

NetName FACEBOOK-INC
NetHandle   NET-173-252-64-0-1

したがって、それらは間違いなく Facebook の IP です。

このようなリクエストは 1 日に 10 ~ 20 件ほどありますが、すべて同じ内容です。7 日分のログ ファイルしか取得できませんが、これらの要求は 7 日前に発生していました。

一意のリンクをテストしたので、そのリンクを見つける方法は他にありません。私は個人的に Facebook をあまり使用しておらず、テスト リンク以外はすべて他のユーザーによって作成/投稿されたものですが、Facebook アカウントにリンクされているすべてのアプリケーションを認識しており、異常は何もないため、サードパーティではないと思いますアプリ (必要に応じてリストを提供できますが、それらはすべて有名なアプリです)

私がログ ファイルを調べたところ、Facebook はこれらのリクエストを巧みに作成しているようには見えませんでした/no_facebook_preview_picture.jpg。クエリ文字列を使用しても、URL の末尾にやみくもに文字列を貼り付けているだけです。例えば;

69.171.228.114 - - [05/Feb/2013:17:19:13 +0000] "GET /iAmNotARealURL1234777?ref=fb&cows_go=moo HTTP/1.1" 404 1118 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "-"
69.171.228.114 - - [05/Feb/2013:17:19:13 +0000] "GET /iamnotarealurl1234777 HTTP/1.1" 404 1118 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "-"
173.252.103.4 - - [05/Feb/2013:17:44:41 +0000] "GET /iAmNotARealURL1234777?ref=fb&cows_go=moo/no_facebook_preview_picture.jpg HTTP/1.1" 404 1118 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)" "-"

Google は、主にリンクの発信者からのランダムな結果を多数表示しているようですが、これらのリクエストが何であるかに関する情報は見つかりませんでした。

これらの要求は何ですか? Facebookは何のためにそれらを必要としますか? これはアプリケーションのエラーですか、それともこれらのリクエストを安全に無視できますか?

アップデート:

数日のうちに、これらの URL に 200 ~ 300 のヒットが表示されるようになりました

[sr@ns309372 nginx]$ for DAYLOG in `find ./ | grep "dftbashort.log-"`; do COUNT=`cat $DAYLOG | grep no_facebook_preview_picture | wc -l`; echo "${DAYLOG} has ${COUNT} occurences"; done
./dftbashort.log-20130201 has 0 occurences
./dftbashort.log-20130130 has 2 occurences
./dftbashort.log-20130129 has 2 occurences
./dftbashort.log-20130128 has 2 occurences
./dftbashort.log-20130202 has 378 occurences
./dftbashort.log-20130207 has 222 occurences
./dftbashort.log-20130205 has 257 occurences
./dftbashort.log-20130209 has 178 occurences
./dftbashort.log-20130131 has 2 occurences
./dftbashort.log-20130203 has 266 occurences
./dftbashort.log-20130206 has 667 occurences
./dftbashort.log-20130204 has 12 occurences
./dftbashort.log-20130127 has 4 occurences
./dftbashort.log-20130208 has 260 occurences

open-graph メタ タグは提供されておらず、ページには meta/javascript リダイレクト以外のコンテンツはありません。

4

2 に答える 2

2

これは、URL のプレビューを作成しようとしている共有スクレーパーであり、Facebook のデバッグ ツールを介して URL を実行すると、Facebook が見ている/探しているものを確認できると確信しています。

/notexistURL/no_facebook_preview_picture.jpgコードにそのような URL を指すものがないと仮定すると、リクエストが何であるかはわかりません。推測する必要がある場合は、メタ タグがない場合に使用される、ある種のデフォルトまたはフォールバックであると言えます。おそらくバグ - Facebook の正しいメタ タグを含めると、それらを取得して無効なリクエストを行わず、Facebook.com やサポートしている他のサイトで URL の共有が見やすくなるという利点があると確信しています。同じタグ

于 2013-02-09T15:33:52.737 に答える