JSoup を使用して、信頼できない HTML をサニタイズしています。私はそれを発見しました
String html = "<div id='foo'><script type='text/javascript'>alert('hello');</script></div>";
String cleanedHtml = Jsoup.clean(html, Whitelist.relaxed());
この時点cleanedHtml
では
<div><div>
したがって、<script>
タグは正しく削除されていますが、不思議なことに、のid
属性も削除されています<div>
。これを削除する正当な理由はありますか、それともバグですか?