4

私はこのHTMLを持っています:

<a href="some content">Click here</a>

Python 2.7でsome contentandclick meを抽出するにはどうすればよいですか?xpath

これまでのところ、次のものがあります( href 結果から「一部のコンテンツ」のみを抽出します):

import lxml.etree as LE
import requests

r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')
4

1 に答える 1

5

XPath を使用して選択できるのはどちらか一方だけですが、すべての<a>要素を選択してから、次のhrefように属性とテキスト コンテンツを選択することもできます。

for elt in root.xpath('//a'):
    print(elt.attrib['href'], elt.text_content())
于 2013-03-07T13:15:29.050 に答える