一部の入力を処理するために Jsoup.clean(String, Whitelist) を使用していますが、Jsoup が許容可能なタグの直前に不要な改行を追加しているようです。インターネット上でこの問題を投稿している人を何人か見ましたが、解決策を突き止めることができませんでした。
たとえば、次のように太字のタグが含まれる非常に単純な文字列があるとします。
String htmlToClean = "This is a line with <b>bold text</b> within it."
String returnString = Jsoup.clean(htmlToClean, Whitelist.relaxed());
System.out.println(returnString);
clean() メソッドの呼び出しから得られるものは、次のようなものです。
This is a line with \n<b>bold text</b> within it.
太字の開始タグの直前に余分な「\n」が追加されていることに注意してください。これが追加されているソースを追跡できないようです (確かに、私は Jsoup を初めて使用します)。
この問題に遭遇した人はいますか? さらに良いことに、この余分な不要な文字がこのように文字列に追加されるのを回避する方法を見つけましたか?