賢明なアドバイスを期待して、初心者プログラマーと潜伏者がここにいます。:)
Python、BeautifulSoup、および Bing API を組み合わせて使用すると、次のコードで必要なものを見つけることができました。
import urllib2
from BeautifulSoup import BeautifulStoneSoup
Appid = #My Appid
query = #My query
soup = BeautifulStoneSoup(urllib2.urlopen("http://api.search.live.net/xml.aspx?Appid=" + Appid + "&query=" + query + "&sources=web"))
totalResults = soup.find('web:total').text
だから私は数千の検索用語でこれをやりたいと思っていました
- このリクエストを 1000 回行うと、サーバーに打撃を与えていると解釈されます。
- 上記のサーバーを攻撃しないようにするには、どのような手順を実行する必要がありますか (ベスト プラクティスとは何ですか?)、および
- 主要な検索エンジン API のいずれかを使用してこれを行う安価な (データ) 方法はありますか?
キーワードごとに 1 つの数字を取得するためだけにすべてのデータを取得するのは、不必要にコストがかかるように思えます。
FWIW、私はいくつかの宿題をして、Bing API に落ち着く前に、Google Search API (非推奨) と Yahoo の BOSS API (まもなく非推奨になり、有料サービスに置き換えられる) を試しました。ページを直接スクレイピングするのは不適切な形式と見なされることを理解しているので、検索エンジンを直接スクレイピングすることはしません。