Hpple を使用して HTML ファイルを渡しています。HTML ファイルは次のようになります。
<div class="entry">
<p>some text here
<a>Inside a</a>
another text here
</p>
<div class="caption">
caption here
</div>
<p>Blah
</p>
</div>
私が見たい結果は、「ここにテキストがあり、別のテキストがここにある」です(これは、キャプション div であるすべてを無視し、内と後のものを含みます)
ここに私が試したいくつかのクエリがあります:
"//div[@class='entry']/p"
結果:"some text here"
"//div[@class='entry']//p"
結果:"some text here caption here Blah"
"//div[@class='entry']/p//text()"
結果:Nothing
ありがとう。