PHP DOM を使用して HTML ドキュメントを作成しています。
ドキュメントの最後に、script 要素を作成します。
スクリプトにエンティティ (具体的には < と >) がある場合、これらは < に変換されます。と >
これらの文字(または私の場合は正規表現)を含む文字列がある場合、これは明らかに問題です
スクリプトタグのみでこの動作を防ぐための非ハックな方法 (つまり、文字列の置換ではない) はありますか?
PHP DOM を使用して HTML ドキュメントを作成しています。
ドキュメントの最後に、script 要素を作成します。
スクリプトにエンティティ (具体的には < と >) がある場合、これらは < に変換されます。と >
これらの文字(または私の場合は正規表現)を含む文字列がある場合、これは明らかに問題です
スクリプトタグのみでこの動作を防ぐための非ハックな方法 (つまり、文字列の置換ではない) はありますか?
通常、これは問題ではありません。<
これらの文字は、 として、または使用した>
場合にのみエンコードされますDOMDocument::saveXML()
。それらを使用する場合は、タグ内にあるDOMDocument::saveHTML()
だけです。<
>
<script>
例:
<?php
/**
* PHP DOM and JavaScript with HTML entities
*
* @link http://stackoverflow.com/q/18487515/367456
*/
$doc = new DOMDocument("1.0");
$doc->loadXML('<head/>');
$javascriptCode = "\n if (1 < 4) {\n alert(\"hello\");\n }\n";
$script = $doc->createElement('script');
$script->appendChild($doc->createCDATASection($javascriptCode));
$head = $doc->getElementsByTagName('head')->item(0);
$scriptInHead = $head->appendChild($script);
echo 'libxml: ', LIBXML_DOTTED_VERSION, "\n"
, "\nXML:\n", $doc->saveXML()
, "\nHTML:\n", $doc->saveHTML()
;
プログラム出力 (デモ (マルチバージョン) ):
libxml: 2.7.8
XML:
<?xml version="1.0"?>
<head><script><![CDATA[
if (1 < 4) {
alert("hello");
}
]]></script></head>
HTML:
<head><script>
if (1 < 4) {
alert("hello");
}
</script></head>