次のhtmlがあると仮定します。
<html>
<body>
<a href="/1234.html">TEXT A</a>
<a href="/3243.html">TEXT B</a>
<a href="/7445.html">TEXT C</a>
<body>
</html>
「TEXTA」を含む要素「a」を検索するにはどうすればよいですか?
これまでのところ私は持っています:
root = lxml.html.document_fromstring(the_html_above)
e = root.find('.//a')
私はもう試した:
e = root.find('.//a[@text="TEXT A"]')
しかし、「a」タグには属性「text」がないため、これは機能しませんでした。
私が試したのと同じようにこれを解決できる方法はありますか?