python - Python 2.7 で xpath を使用して href 値を抽出する

Question

私はこのHTMLを持っています:

<a href="some content">Click here</a>

Python 2.7でsome contentandclick meを抽出するにはどうすればよいですか?xpath

これまでのところ、次のものがあります( href 結果から「一部のコンテンツ」のみを抽出します):

import lxml.etree as LE
import requests

r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')

score 5 · Accepted Answer

XPath を使用して選択できるのはどちらか一方だけですが、すべての<a>要素を選択してから、次のhrefように属性とテキストコンテンツを選択することもできます。

for elt in root.xpath('//a'):
    print(elt.attrib['href'], elt.text_content())

1 に答える 1