次の方法で Google の検索結果をスクレイピングできないのはなぜですか?
をスローする応答を開こうとして失敗していHTTPError
ます。私は他の質問を見てきましたが、私が知る限り、エンコードなどを適切に行っています。
私はキャッチエラーなどを含めていないことを知っています.これは単なる縮小版です.
def scrape_google(query):
url = "http://ajax.googleapis.com/ajax/services/search/web?v=1.0&"
headers = {'User-Agent': 'Mozilla/5.0'}
search = urllib.parse.urlencode({'q': " ".join(term for term in query)})
b_search = search.encode("utf-8")
response = urllib.request.Request(url, b_search, headers)
page = urllib.request.urlopen(response)