simpledom - simpleHTMLDom を使用して XHTML から DIV を抽出し、出力します

Question

タスク - ID を使用して DIV タグ内のコンテンツをスクレイピングし、XHTML を返します。「PHP Simple HTML DOM Parser」を使用しています

単純化されたコードの例:

<html><head></head>
<body>
<h1>Head</h1>
<div class="page">
<div id="content">
<h2>Section head</h2>
<p>Text</p>
</div>
<div id="footer">Footer text</div>
</div>
</body>
</html>

私はコンテンツをOKにすることができます：

$content = $html->find('#content');

$content は、配列~~の simpleDOM オブジェクト~~になりました (修正されました)。

それをXHTMLに戻すにはどうすればよいので、次のようにします。

<div id="content">
<h2>Section head</h2>
<p>Text</p>
</div>

ありがとう

score 0 · Accepted Answer

これはうまくいきました：

// Sample HTML string
$html_str = '<html><head></head><body><h1>Head</h1><div class="page"><div id="content"><h2>Section head</h2><p>Text</p></div><div id="footer">Footer text</div></div></body></html>';

// Create new DOM object
$dom = new DOMDocument();

// $html_str is HTML (can load from URL, if your host allows)
$dom->loadHTML($html_str);

// Get DIV id="content"
$element = $dom->getElementById('content');

// use save XML as input is XHTML.
echo $dom->saveXML($element);

// cleanup to prevent memory leak
$dom->clear(); 
unset($dom);

別のテンプレートで使用する場合は、文字を正しく表示するために正しい文字セットを追加する必要があります

score 0 · Accepted Answer

やってみました：

// Dumps the internal DOM tree back into string 
$str = $content->save();

参照: http://simplehtmldom.sourceforge.net/manual.htm

simpledom - simpleHTMLDom を使用して XHTML から DIV を抽出し、出力します

2 に答える 2

Related

Reference