1

Android アプリで受信している XML 形式の RSS フィードがあります。アイデアは単純で、RSS 更新を受信して​​表示するだけです。いくつかの正しい言葉を示すことを除いて、私はすべてを管理しました。問題は、データが他の言語で書かれていて、私のアプリが英語で書かれていることです (私はそれらについてあまり知りません)。例:

09:05 カミオンディイェ

20:05 Doček naših olimpijaca ispred Skupštine grada

などなど.. Ž、č、š の文字が表示されます.. 他の未知の言語として表示されます.. これを修正する方法を知っている人はいますか.. 書かれているとおりにしたいだけですRSS の XML ファイルでは、まったく変更されていません。

これは私の完全なパーサークラスです:

public class XMLParser {

// constructor
public XMLParser() {

}

/**
 * Getting XML from URL making HTTP request
 * @param url string
 * */
public String getXmlFromUrl(String url) {
    String xml = null;

    try {
        // defaultHttpClient
        DefaultHttpClient httpClient = new DefaultHttpClient();
        HttpPost httpPost = new HttpPost(url);

        HttpResponse httpResponse = httpClient.execute(httpPost);
        HttpEntity httpEntity = httpResponse.getEntity();
        xml = EntityUtils.toString(httpEntity);

    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
    } catch (ClientProtocolException e) {
        e.printStackTrace();
    } catch (IOException e) {
        e.printStackTrace();
    }
    // return XML
    return xml;
}
/**
 * Getting XML DOM element
 * @param XML string
 * */

public Document getDomElement(String xml){
    Document doc = null;
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    dbf.setCoalescing(true);
    dbf.setNamespaceAware(true);
    try {
        DocumentBuilder db = dbf.newDocumentBuilder();

        InputSource is = new InputSource();
            is.setCharacterStream(new StringReader(xml));
            doc = db.parse(is); 

        } catch (ParserConfigurationException e) {
            Log.e("Error: ", e.getMessage());
            return null;
        } catch (SAXException e) {
            Log.e("Error: ", e.getMessage());
            return null;
        } catch (IOException e) {
            Log.e("Error: ", e.getMessage());
            return null;
        }

        return doc;
}

/** Getting node value
  * @param elem element
  */
 public final String getElementValue( Node elem ) {
     Node child;
     if( elem != null){
         if (elem.hasChildNodes()){
             for( child = elem.getFirstChild(); child != null; child = child.getNextSibling() ){
                 //if( child.getNodeType() == Node.TEXT_NODE  ){
                 if(child.getNodeType() == Node.TEXT_NODE || child.getNodeType() == Node.CDATA_SECTION_NODE){
                     return child.getNodeValue();
                 }
             }
         }
     }
     return "";
     //return elem.getTextContent();
 }

 /**
  * Getting node value
  * @param Element node
  * @param key string
  * */
 public String getValue(Element item, String str) {     
        NodeList n = item.getElementsByTagName(str);                
        return this.getElementValue(n.item(0));
    }
 public String getValue2(Element item, String str){
     //NodeList n = item.getElementsByTagNameNS("http://purl.org/rss/1.0/modules/content/", str);
     return item.getTextContent();
 }


}
4

1 に答える 1

0

テキストが utf-8 として解析されることを確認する必要があります。しかし、それを行っても、まだ奇妙な文字がたくさんありますが、これは正常です...多くの言語には奇妙な文字があります。デンマーク (私のルーツ) には æøå があります。

編集

これを試して:

EntityUtils.toString(httpEntity,"UTF-8");
于 2012-08-15T11:43:45.830 に答える