Selenium/webdriver を使用してブラウザーをシミュレートし、それを使用して Web サイトのコンテンツをスクレイピングしたいと考えています。最速の方法ではありませんが、スクリプトの実行など、私にとっては多くの利点があります。
多くの Web サイトでは、Google や bing などの検索エンジンなど、自動化された方法でアクセスすることは禁止されています。
1 つのツールでは、いくつかのキーワードについて Google から推定結果統計を取得する必要があります。これは次のようになります: google.com にアクセスしてキーワードを入力し、結果をスクレイピングするブラウザをシミュレートし、少し間を置いてから次のキーワードを入力し、結果をスクレイピングします...
私の質問は、ブラウザーを手動で使用する代わりに、ブラウザーをシミュレートするためにセレンを使用していることを Web サイトが認識することは可能ですか? 特にGoogleのケースは、私にいくつかの疑問を投げかけます。私は、セレンが部分的にグーグルによって、または少なくともグーグルで働いている何人かによって開発されていることを知っています。それで、セレンにいくつかの指紋が残りますか、それとも私がブラウザを自分で使用しているか、セレンによってシミュレートされているかを判断することはできませんか?