0

urlparse コマンドにヘッダーを追加する方法はないようです。これにより、基本的に Python はデフォルトのユーザー エージェントを使用しますが、これはいくつかの Web ページによってブロックされます。私がやろうとしていることは、本質的にこれと同等のことをすることです:

req = Request(INPUT_URL,headers={'User-Agent':'Browser Agent'})

ただし、urlparse を使用する場合:

parsed = list(urlparse(INPUT_URL))

では、この urlparse を変更して、ヘッダーを取得したり、作成したリクエストで使用できるようにするにはどうすればよいでしょうか? どんな助けでも大歓迎です、ありがとう。

また、私が得ている正確なエラーを知りたい人のために:

urllib.error.HTTPError: HTTP Error 403: Forbidden

これで:

urlretrieve(urlunparse(parsed),outpath)
4

1 に答える 1