...<b><a>hello</a></b>...
<b></b>HTML ドキュメントからタグを削除したいと思います。Jsoupを使用することは可能ですか?
...<b><a>hello</a></b>...
<b></b>HTML ドキュメントからタグを削除したいと思います。Jsoupを使用することは可能ですか?
docドキュメントに HTML が含まれている場合:
doc.select("b").unwrap();
Element( /でも使えますElements)
例:
Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();
これで、ドキュメントには b-Tag が含まれなくなりました
public String clean(String unsafe){
Whitelist whitelist = Whitelist.none();
whitelist.addTags(new String[]{"a"});
String safe = Jsoup.clean(unsafe, whitelist);
return StringEscapeUtils.unescapeXml(safe);
}