ある種の「リバース CSS セレクター」を探しています: HTML ドキュメントが与えられた場合、特定のフォーマットを持つフラグメントをどのように検索することができますか? たとえば、太字のテキスト ( ) を使用するセグメントのリストを取得したいと考えていますfont-weight: bold;
。このドキュメントを考えると:
<h1>example</h1>
<p>This is <b>an example</b> with <span style="font-weight: bold">formatting</span>.
</p>
セグメントのリストには、次のものが含まれます (たとえば、XPath セレクターを介して指定されます)。
/h1[1]
/p[1]/b[1]
/p[1]/span[1]