PHPを使用してHTMLDOMを解析したいと思います。
文字列PNがあり、PNがコンテンツとして検出されたDOM要素のParrentを検出したいと思います。
次に、Parrent要素が見つかったら、それらの要素のすべての子が必要です。
Parrent構造の下にない他のすべてのDOM要素は無視する必要があります。
これは私が何とか書いたものですが、要素(h1、h2、div、span)を取得するために$node->の後に何を書くべきかわかりません...
//start xpath
// Create new DOM object:
$dom = new DomDocument();
// Load HTML code:
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query('//*');
$data = array();
foreach ($nodes as $node) {
$data[] = $node->textContent;
}
if( count( $data ) > 0 )
{
echo '<br/>xpath<br/>';
print_r( $data );
}
//stop xpath