私はJavaでXMLを解析しようとしています
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document doc = db.parse(new ByteArrayInputStream(msg.getBytes("UTF-8")));
こちらも順調のようです
<data>äöü</data>
正しく解析されます (特にドイツ語のウムラウトに関して)。
しかし、解析しようとすると
<däta>xxx</däta>
パーサーは例外をスローし、ウムラウトを含む名前は機能しないようです:
org.w3c.dom.DOMException: WFä at org.apache.harmony.xml.dom.NodeImpl.setName(NodeImpl.java:286) at
org.apache.harmony.xml.dom.AttrImpl.<init>(AttrImpl.java:55) at
org.apache.harmony.xml.dom.DocumentImpl.createAttribute(DocumentImpl.java:324) at
org.apache.harmony.xml.parsers.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:314) at
org.apache.harmony.xml.parsers.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:321) at
org.apache.harmony.xml.parsers.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:128)