0

私はxmlを解析するためにdom4jを使用しています。私はこのようなものを持っているとしましょう:

<?xml version="1.0" encoding="UTF-8"?>
<foo>
    <bar>&#402;</bar>
</foo>

「バー」ノードの値を見ると、「& #402;」で表される特殊文字が返されます。

これを防ぎ、実際のテキストを読む方法はありますか?

4

3 に答える 3

2

ノードの値にbar< または > または & を単独で含めると、パーサーが壊れます。これを防ぐには、すべてのデータをエスケープしてから、再びエスケープ解除する必要があります。

これにより、ドキュメントは次のようになります。

<?xml version="1.0" encoding="UTF-8"?>
<foo>
    <bar>&amp;#402;</bar>
</foo>

それはひどいですが、それはあなたのための XML です。

于 2009-07-20T08:09:40.227 に答える
1

テキストの実際のビットは&#402;? アンパサンドをエスケープする必要があります&amp;

于 2009-07-20T01:14:53.530 に答える