0

Python で Battle.net スクリーン スクレーパーを作成しています。このページをスクレイピングしたいと考えています。

問題は、スクリプトを使用してダウンロードしようとすると 404 が返されることです。ただし、Web ブラウザーで表示すると問題なく動作します。

これが役立つ場合に使用しているコードです(リクエストが必要です):

def download(url, max_retries=10):
    for i in range(max_retries):
        print('Downloading: ' + url)
        r = requests.get(url)

        print('Status code: ' + str(r.status_code))

        if r.status_code == requests.codes.ok: return r.content
    return None

download('http://us.battle.net/sc2/en/game/unit')

回答ありがとうございます。

4

1 に答える 1

0

これを試して。どうやら末尾のスラッシュが必要です。

def download(url, max_retries=10):
    for i in range(max_retries):
        print('Downloading: ' + url)
        r = requests.get(url)

        print('Status code: ' + str(r.status_code))

        if r.status_code == requests.codes.ok: return r.content
    return None

download('http://us.battle.net/sc2/en/game/unit/')
于 2012-08-09T23:08:41.797 に答える