サイトがスクレイパーによってスクレイピングされるのを防ぐことは可能ですか?同時に、検索エンジンがコンテンツを解析できるようにします。
ユーザーエージェントをチェックすることは、それらをシミュレートするのが非常に簡単であるため、最良のオプションではありません。
JavaScriptチェックは(GoogleがJSを実行する)オプションである可能性がありますが、優れたパーサーもそれを行うことができます。
何か案は?
サイトがスクレイパーによってスクレイピングされるのを防ぐことは可能ですか?同時に、検索エンジンがコンテンツを解析できるようにします。
ユーザーエージェントをチェックすることは、それらをシミュレートするのが非常に簡単であるため、最良のオプションではありません。
JavaScriptチェックは(GoogleがJSを実行する)オプションである可能性がありますが、優れたパーサーもそれを行うことができます。
何か案は?
リンクアクセス時間を確認できる可能性があります。つまり、フロントページがヒットした場合、フロントページのリンクはすべて「すばやく」ヒットします。
さらに簡単に、ページにいくつかの非表示のリンクをドロップします。ボットはフォローしますが、人々はほとんどフォローしません。
LukeをチェックするDNSを使用してください!:)
ヘルプ記事「GoogleによるGooglebotの検証」で提供されているのと同じアイデア