1

一部の HTML 文字列からスクリプトを削除するには、JSoup が必要です。そのために次のスニペットを使用します。

Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();

しかし、タグの前に余分なスペースを挿入したり<br>、" や ' を&quot;に変換したり&apos;していますが、これは望ましくありません。これを実現する方法が見つかりませんでした。これを行う JSoup 以外のライブラリの助けや推奨事項をいただければ幸いです。

ありがとう、サンジェイ

4

1 に答える 1

1

使用してみてください:

safeDoc.outputSettings().prettyPrint(false);

私は同じ問題を抱えていましたが、それで修正されました。

于 2012-08-16T11:23:27.363 に答える