0
public XMLParser(InputStream is) {
    try {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder db;
        db = dbf.newDocumentBuilder();
        Document doc = db.parse(is);
        node = doc.getDocumentElement();
    } catch (Exception e) {
        DebugLog.log(e);
    }
}

inputStreamには、「Hey there this is aücharacter」のようなコンテンツが含まれています。文字'ü' 'ü'です。

ノードのコンテンツを読み取ると、System.out.println(node.getTextContent())「これは文字です」というメッセージが表示されます。ü のカットです。

4

2 に答える 2

0

さて、これは有効な文書ですか?エンコーディングが指定されていますか?-> http://www.w3schools.com/XML/xml_encoding.asp

それらが役立つかもしれません:

SAX パーサーに xml 宣言からエンコーディングを決定させるにはどうすればよいですか? http://www.coderanch.com/t/127052/XML/XML-parsers-encoding-byte-order

于 2012-09-22T09:31:03.790 に答える
0

問題は XML エンティティと HTML エンティティでした。HTML エンティティを含むデータを返す Web ページをリクエストします。HTMLエンティティをXMLエンティティに変換する必要がありましたが、うまくいきました!

いくつかのコードについては、この回答を確認してください

于 2012-09-22T10:12:11.530 に答える