Androidアプリケーションでxmlドキュメントを解析する必要があり、Domパーサーを使用しています。xmlファイルのエンコーディングはUTF-8に設定されています。解析に使用しているコードは次のとおりです。
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
InputStream inStream = getAssets().open("words.xml");
InputSource inSource = new InputSource(inStream);
inSource.setEncoding("UTF-8");
Document doc = db.parse(inSource);
しかし、問題は、不正な文字の例外が発生することです。問題のあるノードの構造は次のとおりです。
<obriši>
<item>obriši</item>
<item>ukloni</item>
</obriši>
何が問題なのですか?