現在、HTMLコードをJavaで同等の文字に変換する作業を行っています。以下のコードを文字に変換する必要があります。
è - è
® - ®
& - &
ñ - ñ
& - &
正規表現パターンを使用してみました
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
デバッグすると、matcher.find()
私に与えられますtrue
が、コントロールは、変換用のコードを記述したループをスキップします。そこで何が起こっているのかわからない。
また、この正規表現を最適化する方法はありますか?
どんな助けでも大歓迎です。
例外
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)