1

このような段落タグを含むdivがあります

<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>
<div class="div_5">
                <p>First Paragraph</p>
                <p>Second Paragraph</p>
                <p>Third Paragraph</p>
                <p>Fourth Paragraph</p>
 </div>

私はこれを試したhtmlagiitypackを使用してすべてのパラグラフテキストのテキストを取得する必要があります,

Dim oPB As HAP.HtmlNodeCollection = doc.DocumentNode.SelectNodes("//div[@class='post-bodycopy clearfix']/child::text()/"]
For Each item As HAP.HtmlNode In oPB
                    debug.print(item.InnerText)
                Next

各div文字列に期待される出力は

First Paragraph
Second Paragraph
Third Paragraph
Fourth Paragraph

しかし、返されたテキストにHTMLが含まれています。誰かが問題を修正するのを手伝ってくれますか

4

1 に答える 1

3

段落の内部テキストを実際に選択する必要があります。あなたの xpath は完全に別のものを取得します。

Dim query = doc.DocumentNode.SelectNodes("//div[@class='div_5']/p/text()")
于 2012-06-15T06:09:32.343 に答える