php - 親と子の関係によってコンテンツを抽出するHTMLDOM

Question

PHPを使用してHTMLDOMを解析したいと思います。

文字列PNがあり、PNがコンテンツとして検出されたDOM要素のParrentを検出したいと思います。

次に、Parrent要素が見つかったら、それらの要素のすべての子が必要です。

Parrent構造の下にない他のすべてのDOM要素は無視する必要があります。

score 1 · Accepted Answer

これは私が何とか書いたものですが、要素（h1、h2、div、span）を取得するために$node->の後に何を書くべきかわかりません...

//start xpath
// Create new DOM object:
$dom = new DomDocument();
// Load HTML code:
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//*');
$data = array();
foreach ($nodes as $node) {
    $data[] = $node->textContent;
}
if( count( $data ) > 0 )
{
echo '<br/>xpath<br/>';
print_r( $data );
}
//stop xpath

php - 親と子の関係によってコンテンツを抽出するHTMLDOM

1 に答える 1

Related

Reference