python - リダイレクトのシーケンスで最後の URL を返す

翻译自：https://stackoverflow.com/questions/17062151 2013-06-12T09:34:40.850

2396 次

次のように提供される Beautiful Soup と Requests URL を解析する必要がある場合があります。

http://bit.ly/sdflksdfwefwe

http://stup.id/sdfslkjsfsd

http://0.r.msn.com/sdflksdflsdj

もちろん、これらの URL は通常、http://real-website.com/page.html. 解決/リダイレクトチェーンの最後の URL を取得するにはどうすればよいですか?

私のコードは一般的に次のようになります。

from bs4 import BeautifulSoup
import requests

response = requests.get(url)
soup = bs4.BeautifulSoup(response.text, from_encoding=response.encoding)
canonical_url = response.??? ## This is what I need to know

http://bit.ly/bllshtどこに行くのかを照会するつもりはありませんが、返されるページを既に解析するために Beautiful Soup を使用している場合は、リダイレクトチェーンの最後の正規 URLも取得することに注意してください。

ありがとう。

python - リダイレクトのシーケンスで最後の URL を返す

1 に答える 1

Related

Reference