同様の質問を見たことがありますが、私が見た解決策は次の場合には機能しません。私は XPath の専門家にはほど遠いです。HTMLを解析する必要があるだけです。ヘッダー 2 に続くテーブルを選択するにはどうすればよいですか。以下の解決策はうまくいくと思いましたが、どうやらうまくいかないようです。誰か助けてくれませんか?
content = """<div>
<p><b>Header 1</b></p>
<p><b>Header 2</b><br></p>
<table>
<tr>
<td>Something</td>
</tr>
</table>
</div>
"""
from lxml import etree
tree = etree.HTML(content)
tree.xpath("//table/following::p/b[text()='Header 2']")