PythonでGoogle検索結果を取得したいのですが、これまでのところ、この投稿から学んだ次のスクリプトがあります。
import urllib2
from bs4 import BeautifulSoup
import lxml
import sqlite3
import urllib
import json
def showSome(searchFor):
query = urllib.urlencode({'q':searchFor})
url = 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0&%s'%query
searchResponse = urllib.urlopen(url)
searchResults = searchResponse.read()
results = json.loads(searchResults)
data = results['responseData']
print 'Total results: %s'%data['cursor']['estimatedResultCount']
hits = data['results']
print 'Top %d hits'%len(hits)
for h in hits:
print ' ', h['url']
showSome("site:www.hitmeister.de/shops/")
4380 件の結果が表示されます。ブラウザを使用して同じクエリを検索すると、約 6650 件の結果が得られます。Google からすべての結果を抽出するにはどうすればよいですか? また、これにより上位 4 つの結果が得られます。すべての結果を取得するにはどうすればよいですか?