$dom = new DOMDocument('1.0', 'UTF-8');
$dom->loadHTML($content);
$divs = $dom->getElementsByTagName("div");
foreach ( $divs as $div ) {
if ( $class = $div->attributes->getNamedItem("class") ) {
if ( $class->nodeValue == "simplegalleryholder" )
$div->parentNode->removeChild( $div );
}
}
$content = $dom->saveHTML();
この単純なコードは、削除に役立つはずです
<div class="simplegalleryholder"> .... </div>
ドキュメントから。唯一の問題は、$content に utf8 でエンコードされた特殊文字 (ąęść など) が含まれていることです。これらはプロセスによって破棄されます (代わりに iÄ™ Å‚ ż を取得します)。
正しい結果を得るには、この問題にどのようにアプローチすればよいですか?