一部の HTTP 応答には、<http://www.i_am_a_url.com>;rel="meta data"
.
URLを取得するためのクリーンな方法を知っている人はいますか? 正規表現はコードで恐ろしい読み取りを行うため、可能であれば正規表現を使用したくありません。
一部の HTTP 応答には、<http://www.i_am_a_url.com>;rel="meta data"
.
URLを取得するためのクリーンな方法を知っている人はいますか? 正規表現はコードで恐ろしい読み取りを行うため、可能であれば正規表現を使用したくありません。
lxmlを使用する
impoprt lxml.html
root = lxml.html.fromstring(response_content_string)
for a in root.cssselect('a[href]'):
print(a)
また
impoprt lxml.html
root = lxml.html.fromstring(response_content_string)
for el, attr, url, _ in root.iterlinks():
print(url)