皆さん、リモートファイルをダウンロードしてスクレイプしようとしています。従来のリクエストまたは urllib を使用すると、これが出力ファイルにスローされます。
{
"code" : "not_found",
"error" : true,
"message" : "No service found for this URL."
}
curl/wget またはブラウザを使用すると正常に動作します...
>>> import requests
>>>
>>> url = "http://download.foo.com/filename.zip?function=download"
>>> r = requests.get(url)
>>> print r.content
{
"code" : "not_found",
"error" : true,
"message" : "No service found for this URL."
}
これは、Web サーバーが私を妨げているものですか? 私はcurlにシェルアウトしたくありません、それでもPythonインタープリター内にとどまりたいです:)
ありがとう!