約のサイズの検索クエリのセットがあります。1000万。目標は、検索エンジンによって返されたすべてのヒット数を収集することです。たとえば、Google はクエリ「stackoverflow」に対して約 47,500,000 を返します。
問題はそれです:
1- Google API は、1 日あたり 100 クエリに制限されています。多くのカウントを取得する必要があるため、これは私のタスクにはあまり役に立ちません。
2- Bing API を使用しましたが、正確な数値が返されません。Bing UI に表示されるヒット数と一致するという意味で正確です。以前にこの問題に遭遇した人はいますか?
3- 検索クエリを検索エンジンに発行し、html を解析することは 1 つの解決策ですが、結果は CAPTCHA になり、この数のクエリには対応できません。
私が気にかけているのは、ヒット数だけであり、どんな提案も受け付けています。