HTML ドキュメントからいくつかの値と生の HTML を削除する必要があります。XPath を使用することを考えましたが、クエリを機能させることができません。
これが私が達成したいことです:
<div class="unit-id">
<div class="title">
some title-1
</div>
<div class="another-class">
another class
</div>
<p>segwegw1<p>
<p>segwegw1<p>
<p>segwegw1<p>
<p>segwegw1<p>
<ul>
<li>jfjfj</li>
<li>jfjfj</li>
<li>jfjfj</li>
</ul>
</div>
<div class="unit-id">
<div class="title">
some title-2
</div>
<div class="another-class">
some other class
</div>
<p>segwegw2<p>
<p>segwegw2<p>
<p>segwegw2<p>
<p>segwegw2<p>
</div>
<div class="unit-id">
<div class="title">
some title-3
</div>
<div class="some-other-class">
some other data
</div>
<p>segwegw3<p>
<p>segwegw3<p>
<p>segwegw3<p>
<p>segwegw3<p>
</div>
したがって、クエリが unit-id クラスを使用してそれぞれを反復処理し、クラスdiv
の値と残りの HTML を返し、それ以上は除外して、その特定の unit-id クラスのタグやものだけを返すようにしたいと思います、そして次の反復。divs
title
divs
p
ul
div
それは可能ですか?このクエリの書き方の例を教えてください。それを行うより良い方法はありますか?