java - Javaを使用してhtmlコードをデコードする方法は?

Question

重複の可能性:
Java: HttpUtility.HtmlDecode のような Java で HTML 文字エンティティをデコードする方法は?

titleファイルから (StackOverflow のように) 段落を抽出する必要がありhtmlます。

Java で正規表現を使用して必要なフィールドを抽出できますが、取得しdecodeたフィールドを取得する必要があります。

例

抽出されたフィールド:

Paging Lucene&#39s search results (with **;** among **&#39** and **s**)

デコード後のフィールド:

Paging Lucene's search results

これらのhtmlコードを変換できるJavaのクラスはありますか?

score 30 · Accepted Answer

Apache Commons Langが提供するメソッドを使用する

import org.apache.commons.lang.StringEscapeUtils;
// ...
String afterDecoding = StringEscapeUtils.unescapeHtml(beforeDecoding);

score 3 · Accepted Answer

3

于 2012-12-06T19:12:07.117 に答える

2 に答える 2