DOMDocument を使用して、HTML ファイルの一部を読み取り、以下のコードを使用して別の HTML ページに表示しようとしています。アクセスしようとしている DIV 部分には、いくつかの<p>
タグがあります。<p>
問題は、DOM がファイルを解析するときに、タグ間のテキスト コンテンツのみを取得する (タグを削除する) ことであり、段落の書式設定が失われます。テキストを結合し、すべてを 1 つの段落として表示します。段落がソース ファイルと同じように表示されるように、HTML の書式設定を維持するにはどうすればよいですか?
HTMLコード
<div class="text_container">
<h3>Title</h3>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
<p>Lorem ipsum dolor sit amet, consectetur adipiscing eli.
Lorem ipsum dolor sit amet, consectetur adipiscing eli.</p>
DOMDocumnet コード
<?php
$page = file_get_contents('word.php');
$doc = new DOMDocument();
$doc -> loadHTML($page);
$divs = $doc->getElementsByTagName('div');
foreach($divs as $div) {
if ($div->getAttribute('class') === 'text_container') {
echo '<p>',$div->nodeValue,'</p>';
}
?>