以下のJavaのコンテンツがあり、HTMLタグのみを削除し、改行文字は削除しません。
<p>test1 <b>test2</b> test 3 </p> //line 1
<p>test4 </p> //line 2
上記のコンテンツをテキストリッチエディタで開くと、1行目と2行目が異なる行に表示されます(</p>
タグは表示されません)が、メモ帳ではコンテンツがタグとともに表示され</p>
ます。使用したすべてのhtmlタグを削除するには
Jsoup.parse(aboveContent).text()
すべてのhtml文字を削除します。ただし、メモ帳の1行目と2行目はすべて同じ行に表示されます。どういうわけか、Jsoupは改行文字も削除します。
私が試したこと:-
また、htmlタグを置き換え</p>
てから削除してみました\r\n
Jsoup.parse(contentWith\r\n-Insteadof-</p>Tag ).text()
しかし、それでもJsoupは同じ行の行末文字を削除します(デバッガーの場合と同様に、line1とline2の両方が表示されます)。
JsoupでHTML文字のみを削除し、改行文字は削除しないようにするにはどうすればよいですか?