パスワードで保護された Web サイトにログインするために robobrowser を使用しています。HTMLコードをダウンロードして編集できます。ただし、次の方法を使用すると:
br = RoboBrowser(history=True)
url = 'https://dummywebsite.html/dummy.pdf'
br.open(url)
pdf_file = '/localdir/local.pdf'
with open(pdf_file, 'wb') as output:
output.write("%s" % (br.parsed))
ただし、出力は有効な pdf ファイルではありません。画像をダウンロードしようとすると同じことが起こります。ドキュメントを調べましたが、まだ何も見つかりませんでした。これに代わるものは機械化されているようです。ただし、それに対する python 3 のサポートはありません。
楽しみにするための助けや指針をいただければ幸いです。また、robobrowser がこれを処理できない場合の他の代替手段は大きな助けになります。