urllib2を使用してWebページからデータをフェッチしようとしています。ページはブラウザに表示されますが、スクリプトを介してHTTPError:HTTP Error 403:Forbiddenを取得し続けます
また、ユーザーエージェント文字列を変更してブラウザリクエストを模倣しようとしましたが、成功しませんでした。
これについて何かアイデアはありますか?
urllib2を使用してWebページからデータをフェッチしようとしています。ページはブラウザに表示されますが、スクリプトを介してHTTPError:HTTP Error 403:Forbiddenを取得し続けます
また、ユーザーエージェント文字列を変更してブラウザリクエストを模倣しようとしましたが、成功しませんでした。
これについて何かアイデアはありますか?
改ざんデータとFirefoxを使用してユーザーエージェントのみを送信しようとすると、403が返されます。他のヘッダーを追加してみてください。
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive
試してみましたが、これでうまくいくはずです。
サイトはあなたUser-Agent
がそれを設定したことを確認していますInternet Explorer
:
request.add_header('User-Agent', 'Internet Explorer')
これがで機能することを確認しましたwget
。ユーザーエージェントをInternetExplorerに設定しない限り、403を取得します。
:) NSEからも見積もりを取得しようとしています!pythonFooのように、追加のヘッダーが必要だと言っています。HoweronlyAcceptで十分です。ユーザーエージェントはpythonと言うことができます(trueのままです!)