8

重複の可能性:
Java: HttpUtility.HtmlDecode のような Java で HTML 文字エンティティをデコードする方法は?

titleファイルから (StackOverflow のように) 段落を抽出する必要がありhtmlます。

Java で正規表現を使用して必要なフィールドを抽出できますが、取得しdecodeたフィールドを取得する必要があります。

抽出されたフィールド:

Paging Lucene&#39s search results (with **;** among **&#39** and **s**)

デコード後のフィールド:

Paging Lucene's search results

これらのhtmlコードを変換できるJavaのクラスはありますか?

4

2 に答える 2

30

Apache Commons Langが提供するメソッドを使用する

import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);
于 2012-12-06T18:41:15.360 に答える
3
于 2012-12-06T19:12:07.117 に答える