...<b><a>hello</a></b>...
<b></b>
HTML ドキュメントからタグを削除したいと思います。Jsoupを使用することは可能ですか?
...<b><a>hello</a></b>...
<b></b>
HTML ドキュメントからタグを削除したいと思います。Jsoupを使用することは可能ですか?
doc
ドキュメントに HTML が含まれている場合:
doc.select("b").unwrap();
Element
( /でも使えますElements
)
例:
Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();
これで、ドキュメントには b-Tag が含まれなくなりました
public String clean(String unsafe){
Whitelist whitelist = Whitelist.none();
whitelist.addTags(new String[]{"a"});
String safe = Jsoup.clean(unsafe, whitelist);
return StringEscapeUtils.unescapeXml(safe);
}