いくつかの特殊文字を追加したい dom ドキュメントがあります。
私がやっていることは、最初に正規表現を使用して文字列内の特殊文字を検出することです。そのために、私はhtmlのutf-8文字を変換しています
$string = "Test string 1,§,†,‡";
$string_html = htmlentities($string_html, ENT_QUOTES, "UTF-8");
これは正常に動作し、私はそこに着いています:
"Test string 1,§,†,‡"
今、特殊文字のみを取得したいと思います。そのために、次の配列を返す正規表現を使用しています。
[0] => '§';
[1] => '&dagger';
[2] => '&Dagger';
ここで、これらの特殊文字を dom ドキュメントに追加したいと思いますが、Unicode です。やってみた:
$string_utf8 = html_entity_decode($string_html);
$dom_output->createElement( 'string', utf8_encode($string_utf8));
結果は次のとおりです。
§ 文字は § として表示され、† と ‡ はそのままです。
理由はありますか?