次のように提供される Beautiful Soup と Requests URL を解析する必要がある場合があります。
もちろん、これらの URL は通常、http://real-website.com/page.html
. 解決/リダイレクト チェーンの最後の URL を取得するにはどうすればよいですか?
私のコードは一般的に次のようになります。
from bs4 import BeautifulSoup
import requests
response = requests.get(url)
soup = bs4.BeautifulSoup(response.text, from_encoding=response.encoding)
canonical_url = response.??? ## This is what I need to know
http://bit.ly/bllsht
どこに行くのかを照会するつもりはありませんが、返されるページを既に解析するために Beautiful Soup を使用している場合は、リダイレクト チェーンの最後の正規 URLも取得することに注意してください。
ありがとう。