0

一部の HTTP 応答には、<http://www.i_am_a_url.com>;rel="meta data".

URLを取得するためのクリーンな方法を知っている人はいますか? 正規表現はコードで恐ろしい読み取りを行うため、可能であれば正規表現を使用したくありません。

4

1 に答える 1

-1

lxmlを使用する

impoprt lxml.html

root = lxml.html.fromstring(response_content_string)
for a in root.cssselect('a[href]'):
    print(a)

また

impoprt lxml.html

root = lxml.html.fromstring(response_content_string)
for el, attr, url, _ in root.iterlinks():
    print(url)
于 2013-06-13T14:44:40.203 に答える