私の質問は、XML 1.0で「制御」文字が不正なのはなぜですか?に似ています。-ただし、XML仕様でXMLの制御文字が許可されていない理由ではなく、以下の問題の解決策を探しています。
ユーザーの要求に応じてXMLを含む文字列を出力するサーブレットがあります。1つの特定の要素には、ユーザー入力テキストを含めるために必要なCDATAセクションが含まれています。
ある特定のケースでは、ユーザー入力に文字U + 0001(制御文字)が含まれていることがあります。また、文字セットをUTF-8として指定しても、サーブレットはエラーをスローします。
Error: not well-formed
Location:
<![CDATA[
Java文字列を処理して「XMLセーフ」にする方法はありますか?特に、CDATAセクションに配置するときに安全にするために?
私の質問が明確であることを願っています!
よろしくお願いします、Raj