XMLファイル(RSSフィード)を解析しようとしていますが、xmlファイルにHTMLエンティティ文字が含まれているという問題があり、文字列に変換しても表示されず、エンコード方法がわかりません。
public String getXmlFromUrl(String url) {
String xml = null;
try {
DefaultHttpClient httpClient = new DefaultHttpClient();
HttpPost httpPost = new HttpPost(url);
HttpResponse httpResponse = httpClient.execute(httpPost);
HttpEntity httpEntity = httpResponse.getEntity();
xml = EntityUtils.toString(httpEntity, HTTP.UTF_8);
} catch (UnsupportedEncodingException e) {}
catch (ClientProtocolException e) {}
catch (IOException e) {}
例:これは、Javaコードで取得したいテキストです。
<description>
Amman Post: Shath'a Hasson pointed on the reason about   .... .... ...
</description>
しかし、文字列では、この文字の後のすべてのテキストが失われます&nbsp
そして、私がURLアドレスを解析しようとしたとき:
http://www.ammanpost.net/index.php?page=article&id=25981
私が文字列で取得するのはこれです:
http://www.ammanpost.net/index.php?page=article
'&'文字の後にすべてを失います。
手伝ってくれませんか?ありがとうございました。