0

urllib2を使用してWebページからデータをフェッチしようとしています。ページはブラウザに表示されますが、スクリプトを介してHTTPError:HTTP Error 403:Forbiddenを取得し続けます

また、ユーザーエージェント文字列を変更してブラウザリクエストを模倣しようとしましたが、成功しませんでした。

これについて何かアイデアはありますか?

4

3 に答える 3

2

改ざんデータとFirefoxを使用してユーザーエージェントのみを送信しようとすると、403が返されます。他のヘッダーを追加してみてください。

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive

試してみましたが、これでうまくいくはずです。

于 2010-12-28T13:19:46.043 に答える
1

サイトはあなたUser-Agentがそれを設定したことを確認していますInternet Explorer

request.add_header('User-Agent', 'Internet Explorer')

これがで機能することを確認しましたwget。ユーザーエージェントをInternetExplorerに設定しない限り、403を取得します。

于 2010-12-28T12:49:21.487 に答える
0

:) NSEからも見積もりを取得しようとしています!pythonFooのように、追加のヘッダーが必要だと言っています。HoweronlyAcceptで十分です。ユーザーエージェントはpythonと言うことができます(trueのままです!)

于 2010-12-31T14:32:57.253 に答える