0

Hpple を使用して HTML ファイルを渡しています。HTML ファイルは次のようになります。

    <div class="entry">
        <p>some text here
        <a>Inside a</a>
         another text here
        </p>
       <div class="caption">
        caption here
       </div>
        <p>Blah
        </p>
    </div>

私が見たい結果は、「ここにテキストがあり、別のテキストがここにある」です(これは、キャプション div であるすべてを無視し、内と後のものを含みます)

ここに私が試したいくつかのクエリがあります:

  1. "//div[@class='entry']/p" 結果:"some text here"
  2. "//div[@class='entry']//p" 結果:"some text here caption here Blah"
  3. "//div[@class='entry']/p//text()" 結果:Nothing

ありがとう。

4

2 に答える 2

0

あなたはこれを自分で答えたかもしれませんが、私はちょうど同様の問題を抱えていました. 使用したテキストを取得するには

//div[@class='entry']//a[@inside]//*

これにより、あなたが内部と呼んでいるものの内部にあるテキストが得られました。これがうまくいくかどうか教えてください。私自身はまだ HTML の解析を学んでいます。幸運を。

于 2013-04-25T12:56:40.327 に答える