わかりました、これに対する解決策を見つけることができなかったので、誰かが助けてくれることを願っています.
データベースでは、顧客は次のような異なる文字セットから文字データをインポートまたは追加することができました。
<E2><80><99>
これはUTF-16だと思います。
私のスクリプトの XML 出力は、このデータが原因でエラーをスローしています (データベースから「説明」フィールドなどの文字列を取得し、XML ファイルを作成します)。
XML 解析エラー: 行番号 20、列 50 は整形式ではありません。
<80><99> のように、より長い他の 16 進数があります (単なる例です。これが実際の文字かどうかはわかりません)。
XML ファイルを有効にして、文字セットをダウンスケールするか、次のように UTF-32 を使用するようにするにはどうすればよいですか。
AddType "application/xml; charset=UTF-32" xml (in .htaccess file along with filesmatch .xml)
<?xml version='1.0' encoding='UTF-32' ?> (placed in head of xml file)