とを使用して抽出されたhtmlのスニペットがDocument doc =jsoup.connect(someUrl).get()
ありますElements body=doc.select("div.chapter")
String myHtml = "
<div class="chapter">
<h1>Hello this is my example</h1>
<p>This is paragraph one</p>
<p>This is paragraph two <sup class="num">Nuisance 1</sup><span class="notes">Nuisance 2</span></p>
<p>This is paragraph three</p>
</div>"
<sup> </sup>
と<span> <\span>
そのコンテンツを JSOUP で削除したい。正規表現構文を使用するのは悪い考えだと読みました。そして、ほとんどの例と回答は、タグを削除してコンテンツを保持するためにこの質問に対処しています。私が取得したいのは次のとおりです。
String newHtml = "
<div class="chapter">
<h1>Hello this is my example</h1>
<p>This is paragraph one</p>
<p>This is paragraph two</p>
<p>This is paragraph three</p>
</div>"
JSOUP を使用しましたが、満足のいく結果は得られませんでした (SUP および SPAN エンティティ/タグが保持されます)。