0

Java での xml 解析に問題があります。テキストで見つかった引用は、さまざまなブラウザのテキスト エンコーディングで次のようになります。

iso-8859-1 | utf-8
(“ | “
†  | ”
’  | ’

Androidアプリに表示するために、両方をxml文字列で解析しようとしました。ただし、どちらのシンボルも正常に解析できません。

テキストを解析する前に、「 to 」と「 to 」を置き換える (そしてそれらを php でエンコードする) 必要があります。

それはなぜですか?XML パーサーは特別な記号を許可していませんか?

4

1 に答える 1

0

ほとんどの XML パーサーでは、入力のエンコーディングを指定できます。XMLPullParser を使用している場合は、次のように変更できます。

parser.setInput(this.getInputStream(),"UTF-8");

InputStream で SAX を使用している場合は、InputStream のエンコーディングを次のように変更します。

is.setEncoding("UTF-8");
于 2012-07-14T11:59:45.827 に答える