xpath - 特定のノード要素の下のノードを取得する

Question

ここで私の問題について助けが必要か、少なくともいくつかのアドバイスが必要です。XPATH を使用して HTMLcleaner を使用して HTML ドキュメントを解析しています。

私はこのようなものを持っています:

<html>

[code and other <h4> tags]

<h4>Random name</h4>
<a href="link" target="target"> Text I want to get </a>
<a href="link2" target="target2"> Text I want to get 2 </a>
<a href="link3" target="target3"> Text I want to get 3 </a>
<a href="link4" target="target4"> Text I want to get 4 </a>
<h4> Random name 2 </h4>
<a href="link" target="target"> Text I don't want to get </a>


[code and other <h4> tags]
</html>

Ok。いくつかの<h4>タグがあり、それぞれに<a>タグといくつかのテキストがあります。私の問題は、「h4 [i]」のように、特定のからそれぞれのテキストをすべて取得する方法がわからないことです。私はこのようなことを試しましたが、うまくいきませんでした:

String xpath = "h4["+number+"]//a" //where number will increment

アドバイスありがとうございます！

score 1 · Accepted Answer

使用：

/*/h4[1]/following-sibling::a[not(preceding-sibling::h4[2])]/text()

XSLTベースの検証：

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output method="text"/>
 <xsl:strip-space elements="*"/>

 <xsl:template match="/">
   <xsl:copy-of select=
   "/*/h4[1]/following-sibling::a[not(preceding-sibling::h4[2])]/text()"/>
 </xsl:template>
</xsl:stylesheet>

この変換が次のXMLドキュメント（提供されたフラグメント、単一の最上位要素にラップされて整形式のXMLドキュメントになる）に適用される場合：

<html>
    <h4>Random name</h4>
    <a href="link" target="target"> Text I want to get </a>
    <a href="link2" target="target2"> Text I want to get 2 </a>
    <a href="link3" target="target3"> Text I want to get 3 </a>
    <a href="link4" target="target4"> Text I want to get 4 </a>
    <h4> Random name 2 </h4>
    <a href="link" target="target"> Text I don't want to get </a>
</html>

Xpath式が評価され、選択されたすべての（テキスト）ノードが出力にコピーされます。

 Text I want to get  Text I want to get 2  Text I want to get 3  Text I want to get 4

xpath - 特定のノード要素の下のノードを取得する

1 に答える 1

Related

Reference