ボットプログラムではなく、人間が異なる Web ページに確実にアクセスするにはどうすればよいですか? 何かテクニックはありますか?
ありがとう
if(strstr(strtolower($_SERVER['HTTP_USER_AGENT']), "googlebot"))
{
// Google Bot visits you
}
これは、訪問者が GoogleBOT であるかどうかを調べる PHP の例です。
時間は、訪問が人間であるかボットであるかを正確に測定するのに役立ちます。
1秒または2秒後に実行するユーザーの訪問を追跡するJavaScriptでタイムアウトまたは遅延を設定した場合。ほとんどの人間は少なくともその時間はページにアクセスしますが(たとえそれが気に入らなくても)、ボットはその時間にスキャンして先に進むことができるはずです。
ちょっとした考え。
HTTP ヘッダーのユーザー エージェントを変更するか、ボットのようなアクティビティを探すことができます。たとえば、単一の IP アドレスから広範囲のページで非常に高い頻度でヒットが発生しているなどです (ただし、プロキシ サーバーでも同様のことが見られる場合があります)。 )。また、Robots.txt でヒットを探して、同じセッション内の他の訪問がロボットからのものであると想定することもできます。
実際には、洗練されたロボット ライターがブラウザのふりをする可能性があるため、確実な方法はありません。