本物のページ ヒットを監視しようとしています。これが私のサイトの機能です。人々が記事を投稿できる記事ディレクトリがあります。記事が投稿されると、ページにアクセスしたユニーク ユーザーの数に応じて報酬が支払われます。そのため、ページのヒット数は重要です。これが私が直面している問題です。
必要なもの:
- マイナーな検索エンジンやロボットによるページ ヒットを追跡したくありません。
- 主要な 4 つの検索エンジンに私のサイトを閲覧してもらいたいのですが、IP アドレスで監視でき、訪問をページ ヒットとしてカウントしないからです。スパム ボットは本物の人間または主要な検索エンジンとして十分に機能するため、これを行うことはできません。
問題:
- インターネット上には、robot.txt ファイルを無視するスパム ボットが存在します。
- 本物の人間のユーザーになりすますボットがあります。ヘッダー内のユーザー エージェントなどを操作することによって。
- データベースで適切な IP アドレスを常にチェックすることにより、パフォーマンスが低下する可能性があります。
- 人間は、ロボットが自分のページを表示できるようにするためだけに、キャプチャをバイパスできます
可能な解決策:
- すべてのページでキャプチャを要求します。キャプチャが通過した場合。次に、IP アドレスを有効としてログに記録するか、合格したことを示す Cookie をユーザーのマシンに送信します。
- すべての主要な検索エンジンの IP アドレスを許可して、キャプチャが表示されないようにする
- ボット検出ソフトウェアを購入する
- 視聴者に 7 日ごとにキャプチャを渡すよう要求する
このサイトが適切に機能するためには、正確な人間のページ ビューを取得することが重要です。他にアイデアはありますか