2

私が書いたように、非常に強力な保護クラス「BlockIp」は、IP のブラックリストを使用でき、奇妙な IP 構成を検出でき、プロキシもブロックできます。

訪問者が見つかると、訪問者、ブロックされた理由、および彼らが何をしようとしていたかについての詳細な電子メールを受け取ります (もちろん 1 日 1 回)。過去にこのクラスによってブロックされた実際の攻撃をいくつか受けたため、非常にうまく機能しているようです。合法的なボットをブロックするわけではありませんが、検出方法が正しいかどうかをテストするのは簡単ではありません。

今日、クラスから、Google のロボットであると自認する「 crawl-6-249-76-64.googlebot.com 」をブロックしたというメールを受け取りました。ネットでブラックリストに載っていないか調べてみましたが、どこにもブラックリストに載っていませんでした。「66.249.76.64」をグーグルで検索すると、IPが多くのサイトにリストされていることがわかりました。

クラスから2通のエラーメールが届きました。1 つ目は「ボット」が「robots.txt」にアクセスしようとした場合で、2 つ目はサイトのルートにアクセスしようとした場合です。

私の質問は: これは Google ボットですか? (true の場合、検出に何か問題があり、それを修正する必要があります)。Google の IP 範囲で IP が見つかりませんでした: http://chceme.info/ips/

ボットに関する情報は次のとおりです。

Ticket ID : {EVNT_117162_2013011220130110_32925_19904}
Event type : Access blocked
Event date : 01/12/2013 - 03:53:01 (server date-time)
Event counter : First occurring
Processed url : mysite/robots.txt
From url : Unknown or direct link
Domain : mysite
Domain IP : 000.000.000.000
Visitor IP : 66.249.76.64
Proxy IP : (not present)



Problem : Potential danger detected - 66.249.76.64
Hostname : crawl-66-249-76-64.googlebot.com
Block : Yes
Refferer : (direct access)
AgentString : Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Browser : Mozilla 5.0
Platform : Unknown Platform
Robot : Yes - Googlebot
Mobile : No
Tablet : No
Console : No
Crawler : Yes
Agent_type : crawler
Agent_name : googlebot
Agent_version : 2.1
Os_type : unknown
Os_name : unknown
Agent_languagetag : en
Status : ok
Request : 66.249.76.64
Languagecode : us
Country : United States
Region : California
City : Mountain View
Zipcode : 94043
Latitude : 37.3861
Longitude : -122.084
Timezone : -08:00
Areacode : 650
Dmacode : 807
Continentcode : na
Regioncode : ca
Currencycode : USD
Currencysymbol : $
Currencysymbol_utf8 : $
Currencyconverter : 1
Extended : 1
4

1 に答える 1

2

まず第一に、はい、これはグーグルです。https://support.google.com/webmasters/bin/answer.py?hl=en&answer=80553で説明されているように、Google ボットを確認できます。
ちなみに、「最初のものは、「ボット」がしようとしたときです。 access "robots.txt" " ボットは常に /robots.txt へのアクセスを許可する必要があります

于 2013-01-12T13:25:01.283 に答える