3

私は、カスタマイズされた Google アナリティクス (およびその他のアナリティクス) が提供できる特別な機能を使用して、独自の訪問者追跡を行っています。スクリプトの終わり近くでこの関数を呼び出していましたが、ボット (Google だと思います) から数千のページが呼び出されているクライアントにすぐに出くわしました。月。

ほとんどの人が使用する方法は、ページの下部で Javascript を使用することです。ボットは JavaScript を操作しないため、これは簡単な修正ですが、PHP ソリューションを探しています。

最後に行ったのは、PHP の使用get_browserです。

http://us2.php.net/manual/en/function.get-browser.php

crawlerそしてアスペクトをチェックします。これはうまくいきませんでした。

私はこの投稿を見てきました: スクリプターがあなたのウェブサイトを毎秒何百回も非難するのを止める

しかし、それに対する主な解決策は、CAPTCHA を表示する SO に似た処理を行うことでした。私が言いたいのは、ボットを止めることではなく、ページをクロールしてもらいたいということです。訪問者がそこにいるときに、訪問者追跡データを送信したくないだけです。

ユーザーがいらいらし、統計が不正確になったため、AJAX リクエストを実行する Javascript ソリューションに今すぐ切り替えました。

4

1 に答える 1

1

私はその機能を以前に使用したことがありません - 興味深いです。

現在、すべての主要な検索エンジンは、個別の User-Agent ヘッダーを使用して自分自身を宣言します。これは、この関数がほとんどの情報を取得していると私が想定している場所です。おそらく、ルックアップ テーブルに対して User-Agent の値を照合しています。新しいインデクサーが正しく識別されていないこと。

独自のリストを作成し、それに対して $_SERVER['HTTP_USER_AGENT'] スーパーグローバルをテストすることもできますが、更新を監視する必要があります。

また、悪いインデクサーや悪意のあるインデクサーも停止しません。これは、通常のブラウザーに偽装する傾向があるためです (クライアントからの他のヘッダーと同様に、User-Agent は信頼されません)。

于 2010-05-27T07:52:43.453 に答える