1

重複の可能性:
Python の urllib2 が一部のサイトで機能しない

OK、Python を使用してこの URL にアクセスしたいだけです: http://www.gocomics.com/wizardofid/2013/01/22

しかし、urllib2.urlopen(' http://www.gocomics.com/wizardofid/2013/01/22 ').read() を呼び出すたびに、403 エラーが発生します。urllib では、エラー ページを読むことしかできませんが、urllib2 ではエラーが発生します。Chrome でページを見ると、問題はありません。これはなぜですか、どうすれば修正できますか? ありがとう!

4

1 に答える 1

3

この特定の Web サイトには、「ブラウザに似た」User-Agentヘッダーが必要です。そうしないと、アクセスが拒否されます。

(たとえば) 次のようなヘッダーを追加してみてください。

import urllib2

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib2.install_opener(opener)
print urllib2.urlopen('http://gocomics.com/wizardofid/2013/01/22').read()
于 2013-01-23T02:45:49.893 に答える