重複の可能性:
UTF-8 でエンコードされた XML ファイルの解析
いくつかのアラビア文字を含む UTF-8 でエンコードされた XML ファイルを解析しています。アラビア文字が表示されないことを除いて、他のすべては正常に機能しています。いくつかの奇妙な文字が以下のように表示されます。
ÙØ±ÙÙ
解析中の XML " http://212.12.165.44:7201/UniNews121.xml " ファイルへのリンクは次のとおりです。
以下はコードです
public String getXmlFromUrl(String url) {
try {
return new AsyncTask<String, Void, String>() {
@Override
protected String doInBackground(String... params) {
//String xml = null;
try {
DefaultHttpClient httpClient = new DefaultHttpClient();
httpClient.getParams().setParameter(CoreProtocolPNames.HTTP_CONTENT_CHARSET,"UTF-8");
HttpGet httpPost = new HttpGet(params[0]);
HttpResponse httpResponse = httpClient.execute(httpPost);
HttpEntity httpEntity = httpResponse.getEntity();
xml = new String(EntityUtils.toString(httpEntity).getBytes(),"UTF-8");
} catch (Exception e) {
e.printStackTrace();
}
//just to remove the BOM Element
xml=xml.substring(3);
//Here am printing the xml and the arabic chars are malformed
Log.i("DEMO", xml);
return xml;
}
}.execute(url).get();
} catch (InterruptedException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (ExecutionException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return xml;
}
エラーは発生しておらず、アラビア文字の形式が正しくないだけで、すべてが正常に機能していることに注意してください。
助けていただければ幸いですが、具体的な回答をお願いします