Web サイトからファイルをダウンロードする (しようとする) ために urllib2 を使用しています。ファイルは、いくつかのフォーム フィールドを指定した後にのみダウンロードできます。次のように、リクエストを作成して問題なくレスポンスを取得できます。
req = urllib2.Request(url, data, headers)
response = urllib2.urlopen(req)
このような応答ヘッダーprint response.info()['Content-Disposition']
を見ると、そこにファイルが表示されます。つまり、次のようなものが出力されますattachment;filename=myfile.txt
しかし、実際に添付ファイルをダウンロードするにはどうすればよいですか? その場合response.read()
、url にあるページの HTML を含む文字列を取得するだけです。ポイントは、url はファイルではなく、「添付ファイル」を含む Web ページであり、その添付ファイルを urllib2 でダウンロードしようとしているということです。添付ファイルは動的に生成されるため、サーバー上にあるだけではありません。