重複の可能性:
Java: HttpUtility.HtmlDecode のような Java で HTML 文字エンティティをデコードする方法は?
title
ファイルから (StackOverflow のように) 段落を抽出する必要がありhtml
ます。
Java で正規表現を使用して必要なフィールドを抽出できますが、取得しdecode
たフィールドを取得する必要があります。
例
抽出されたフィールド:
Paging Lucene's search results (with **;** among **'** and **s**)
デコード後のフィールド:
Paging Lucene's search results
これらのhtmlコードを変換できるJavaのクラスはありますか?