次の PHP スクリプトを使用して、一部のデータを xml ファイルに保存しようとしています。
<?php
$string = '<a href="google.com/maps">Go to google maps</a> and some special characters ë è & ä etc.';
$string = htmlentities($string, ENT_QUOTES, 'UTF-8');
$doc = new DOMDocument('1.0', 'UTF-8');
$doc->preserveWhiteSpace = false;
$doc->formatOutput = true;
$root = $doc->createElement('top');
$root = $doc->appendChild($root);
$title = $doc->createElement('title');
$title = $root->appendChild($title);
$id = $doc->createAttribute('id');
$id->value = '1';
$text = $title->appendChild($id);
$text = $doc->createTextNode($string);
$text = $title->appendChild($text);
$doc->save('data.xml');
echo 'data saved!';
?>
htmlentities を使用して、すべての文字列を html 形式に変換しています。これを省略すると、特殊文字は html 形式に変換されません。これは出力です:
<?xml version="1.0" encoding="UTF-8"?>
<top>
<title id="1">&lt;a href=&quot;google.com/maps&quot;&gt;Go to google maps&lt;/a&gt; and some special characters &euml; &egrave; &amp; &auml; etc.</title>
</top>
HTML タグのアンパサンドは 2 つの HTML コードを取得し&lt;
、アンパサンドは次のようになります。&amp;
これは正常な動作ですか?または、どうすればこれを防ぐことができますか?二重エンコーディングのように見えます。