1

私は jsoup 初心者です。次の HTML 文字列をサニタイズしようとしています。文字列 html = "<html><head><body bgcolor=\"red\"><p>sidd</p></body></html></head>";

ボディタグを残したいので、以下のようにホワイトリストを作成しました

    Whitelist w = Whitelist.relaxed();
    w.addTags("html");
    w.addTags("head");
    w.addTags("body");
    w.addAttributes("body","bgcolor");

この出力は次のようになり<p>sidd</p>ます。サニタイズされた出力で「body」タグを保持する方法を教えてもらえますか?

4

3 に答える 3

0

jsoup を使用した解析では、html はサニタイズされません。

于 2013-01-06T12:16:36.570 に答える
0

-メソッドを使用できますparse()

final String html = "<html><head><body bgcolor=\"red\"><p>sidd</p></body></html></head>";

Document doc = Jsoup.parse(html); // Make shure you import 'org.jsoup.nodes.Document'

System.out.println(doc); // Output your html or whatever

出力:

<html>
 <head></head>
 <body bgcolor="red">
  <p>sidd</p>
 </body>
</html>

body-tag のみが必要な場合は、 を使用しますdoc.select("body")。出力:

<body bgcolor="red">
 <p>sidd</p>
</body>
于 2012-11-15T16:23:00.207 に答える