java - dom4j テキストを特殊文字に変換する

Question

私はxmlを解析するためにdom4jを使用しています。私はこのようなものを持っているとしましょう：

<?xml version="1.0" encoding="UTF-8"?>
<foo>
    <bar>&#402;</bar>
</foo>

「バー」ノードの値を見ると、「& #402;」で表される特殊文字が返されます。

これを防ぎ、実際のテキストを読む方法はありますか?

score 2 · Accepted Answer

ノードの値にbar< または > または & を単独で含めると、パーサーが壊れます。これを防ぐには、すべてのデータをエスケープしてから、再びエスケープ解除する必要があります。

これにより、ドキュメントは次のようになります。

<?xml version="1.0" encoding="UTF-8"?>
<foo>
    <bar>&amp;#402;</bar>
</foo>

それはひどいですが、それはあなたのための XML です。

score 1 · Accepted Answer

テキストの実際のビットはƒ? アンパサンドをエスケープする必要があります&。

3 に答える 3