この org.jdom.Document があり、そこから要素を取得し、xpath で値を出力しようとしています。問題は、ノルウェー語の文字が ? として出てくることです。æ ø å の代わりに。
Element nameNode = (Element) XPath.selectSingleNode( element, "contentdata/name" );
System.out.print(nameNode.getText());
// Produces "S?rbyen"
私が使うとき
XMLOutputter outputter = new XMLOutputter( Format.getPrettyFormat());
outputter.output( nameNode, System.out );
// Produces "<name>Sørbyen</name>"
では、XPath.selectSingleNode() または nameNode.getText() を使用して適切な UTF-8 を返すにはどうすればよいでしょうか?
更新: 文字列はコンソール出力でのみ変更され、nameNode.getText().equalsIgnoreCase("Sørbyen") を比較すると true が返されることが判明しました。