1

重複の可能性:
Java: HttpUtility.HtmlDecode のような Java で HTML 文字エンティティをデコードする方法は?

この形式でエンコードされたいくつかの特殊文字を含む文字列データがあります&#039

この場合、エンコーディングは ' 記号、一重引用符です。

その例はの"the citizen&#039s home"ように見えるはずです"the citizen's home"が、そうではありません。

残念ながら、これはそのように解釈されません。これらの文字列をすべて解析して変換する必要があります

最初: そのフォーマットは何と呼ばれているか、これは変換方法を見つけるのに役立ちます

2番目: 私の弦を直す方法を知っていますか?

4

1 に答える 1

3

車輪を再発明する必要はありません。Apache Commons Lang のStringEscapeUtils.unescapeHtml4(String)が必要です。

エンティティ エスケープを含む文字列を、エスケープに対応する実際の Unicode 文字を含む文字列にエスケープ解除します。HTML 4.0 エンティティをサポートします。

たとえば、文字列"&lt;Fran&ccedil;ais&gt;"は次のようになり ます"<Français>"

エンティティが認識されない場合はそのままにして、そのまま結果文字列に挿入します。など"&gt;&zzzz;x"になり">&zzzz;x"ます。

于 2012-07-09T18:12:04.340 に答える