PHP の DOMDocument オブジェクトを使用して HTML (cURL で取得) を解析しています。ID で要素を取得して出力すると、空の<span> </span>
タグは追加の文字を取得して になり<span>Â </span>
ます。
コード:
<?php
$document = new DOMDocument();
$document->validateOnParse = true;
$document->loadHTML( curl_exec($handle) );
curl_close($handle);
$element = $document->getElementById( __ELEMENT_ID__ );
echo $document->saveHTML();
echo $document->saveHTML($element);
?>
コマンドは期待どおりに動作し、$document->saveHTML()
ページ全体を印刷します。しかし、上で言ったように、echo $document->saveHTML($element)
コマンドで空の<span>
タグを に変換し<span>Â </span>
ます。
これは、<span> </span>
内のすべてのタグで発生します$element
。
この余分な文字を挿入しているのは、このプロセス (ID で要素を取得して要素を出力するプロセス) の何ですか? 私はそれを回避できますが、根本に到達することにもっと興味があります。