2

私はこの奇妙な状況にあり、

現在所有しているすべてのブラウザで機能するリンクがあります ( )。 を使用しchrome,IE,firefoxてページをクロールしようとしました。しかし、私は匿名でクロールするために使用していますscrapypythonresponse.status == 400tor + polipo

response.bodyは :

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html><head>
<title>Proxy error: 400 Couldn't parse URL.</title>
</head><body>
<h1>400 Couldn't parse URL</h1>
<p>The following error occurred while trying to access <strong>https://exmpale.com/blah</strong>:<br><br>
<strong>400 Couldn't parse URL</strong></p>
<hr>Generated Thu, 11 Dec 2014 13:55:38 UTC by Polipo on <em>localhost:8123</em>.
</body></html>

なぜそうあるべきなのか疑問に思っています.ブラウザは結果を得ることができますが、できないのscrapyでしょうか?

4

0 に答える 0