現在、からデータを抽出する作業を行っていますHTML
。<p class="xfHeading">
2つのタグの間のテキストを抽出したいと思います。
<p class="xfHeading"><b>XYZ:</b></p>
<p>asdfghjk</p>
<p>sdsdsd</p>
<p>asdvcvcfghjk</p>
<p class="xfHeading"><b>ABC:</b></p>
<P>fvgbhnjm</P>
<p class="xfHeading"><b>PQR:</b></p>
<ul>
</ul>
<p class="xfHeading"><b>MNO:</b></p>
<ul>
<li>jdjshdj</li>
</ul>
出力は次のようになります。
asdfghjk
sdsdsd
asdvcvcfghjk
これを行う1つの方法は次のとおりです。
/p[class="xfHeading"]/following-sibling::p[0]|/p[class="xfHeading"]/following-sibling::p[1]|/p[class="xfHeading"]/following-sibling::p[2]
また
/p[class="xfHeading"]/following-sibling::p[position()<4]
ただし、その間のコンテンツは常に変化し続けるため、2つのタグ間のコンテンツを<p class="xfHeading">
抽出するソリューションが必要です。