1

Python を使用して次のコードで URL を開くと、時々このエラーが発生します。

from urllib import urlopen url = "http://www.gutenberg.org/files/2554/2554.txt" raw = urlopen(url).read()

エラー:'\n\n403 禁止\n\n

禁断

\n

/files/2554/2554.txt\n このサーバーにアクセスする権限がありません。

\n
\nwww.gutenberg.org ポート 80 の Apache サーバー\n\n'

これは何ですか?

ありがとうございました

4

1 に答える 1

2

これは、ヘッダー「User-Agent」を使用してリクエストを行っているため、PythonアクセスをブロックするWebページです。

これを回避するには、「urllib2」モジュールをダウンロードして、次のコードを使用します。

req = urllib2.Request(url, headers ={'User-Agent':'Chrome'})
raw = urllib2.urlopen(req).read()

あなたはヘッダー「Chrome」でサイトにアクセスすることを知っていて、もはや禁止されるべきではありません(私はそれを自分で試しました、そしてそれはうまくいきました)。

お役に立てれば。

于 2013-03-19T13:58:26.937 に答える