1

次のような奇妙なフォーマットを含む XML ファイルがあります。

<?xml version=3D3D"1.0" encoding=3D3D"ISO-8859-1"?>

「3D3D」に注目してください。さらに、ファイルの残りの部分では、行は約 78 文字で改行され、次の行に沿ってさらに「3D」が含まれています。

Supercalifragilis=
=3D
ticexpialidocious=
=3D

最初は、すべて ISO-8859-1 エンコーディングに関連しているのではないかと考えていましたが、テキストを PHP で実行してmb_convert_encoding($xml, "UTF-8", "ISO-8859-1")も、それは何も変わらないように見えました。

これらの特定の奇妙な文字とフォーマットに詳しい人はいますか? もしそうなら、SimpleXMLのようなものでファイルをきれいに解析できるように、変換のためにクリーンアップする簡単な方法をお勧めできますか?

4

1 に答える 1

2

奇妙な点は、QP (Quoted Printable) エンコーディングです。 =xx は、16 進コード xx の文字を表します。たとえば、=3D は等号「=」を表します。QP では、ソフト改行は行末の「=」です。つまり、データは2 回QP エンコードされたようです。

したがって、quoted_printable_decodeが役立つことを願っています。

于 2012-05-25T07:09:17.177 に答える