0

PHP DOM を使用して HTML ドキュメントを作成しています。

ドキュメントの最後に、script 要素を作成します。

スクリプトにエンティティ (具体的には < と >) がある場合、これらは < に変換されます。と >

これらの文字(または私の場合は正規表現)を含む文字列がある場合、これは明らかに問題です

スクリプトタグのみでこの動作を防ぐための非ハックな方法 (つまり、文字列の置換ではない) はありますか?

4

1 に答える 1

2

通常、これは問題ではありません。&lt;これらの文字は、 として、または使用した&gt;場合にのみエンコードされますDOMDocument::saveXML()。それらを使用する場合は、タグ内にあるDOMDocument::saveHTML()だけです。<><script>

例:

<?php
/**
 * PHP DOM and JavaScript with HTML entities
 *
 * @link http://stackoverflow.com/q/18487515/367456
 */

$doc = new DOMDocument("1.0");
$doc->loadXML('<head/>');

$javascriptCode = "\n  if (1 < 4) {\n    alert(\"hello\");\n  }\n";

$script = $doc->createElement('script');
$script->appendChild($doc->createCDATASection($javascriptCode));

$head         = $doc->getElementsByTagName('head')->item(0);
$scriptInHead = $head->appendChild($script);

echo 'libxml: ', LIBXML_DOTTED_VERSION, "\n"
    , "\nXML:\n", $doc->saveXML()
    , "\nHTML:\n", $doc->saveHTML()
;

プログラム出力 (デモ (マルチバージョン) ):

libxml: 2.7.8

XML:
<?xml version="1.0"?>
<head><script><![CDATA[
  if (1 < 4) {
    alert("hello");
  }
]]></script></head>

HTML:
<head><script>
  if (1 < 4) {
    alert("hello");
  }
</script></head>
于 2013-08-28T12:27:02.713 に答える