私はこのHTMLを持っています:
<a href="some content">Click here</a>
Python 2.7でsome content
andclick me
を抽出するにはどうすればよいですか?xpath
これまでのところ、次のものがあります( href 結果から「一部のコンテンツ」のみを抽出します):
import lxml.etree as LE
import requests
r = requests.get("http://localhost")
html = r.text
root = LH.fromstring(html)
print root.xpath('//a/@href')