一部の HTML 文字列からスクリプトを削除するには、JSoup が必要です。そのために次のスニペットを使用します。
Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();
しかし、タグの前に余分なスペースを挿入したり<br>
、" や ' を"
;に変換したり'
していますが、これは望ましくありません。これを実現する方法が見つかりませんでした。これを行う JSoup 以外のライブラリの助けや推奨事項をいただければ幸いです。
ありがとう、サンジェイ