Web サイトから特定の生のテキストを取得しようとしています。このサイトと他の情報源を使用して、simpleXML と xpath を使用して特定の画像を取得する方法を学びました。
ただし、生のテキストを取得するために同じアプローチが機能していないようです。現在機能していないのは次のとおりです。
// first I set the xpath of the div that contains the text I want
$xpath = '//*[@id="storyCommentCountNumber"]';
// then I create a new DOM Document
$html = new DOMDocument();
// then I fetch the file and parse it (@ suppresses warnings).
@$html->loadHTMLFile($url);
// then convert DOM to SimpleXML
$xml = simplexml_import_dom($html);
// run an XPath query on the div I want using the previously set xpath
$commcount = $xml->xpath($xpath);
print_r($commcount);
画像を取得すると、その commcount オブジェクトは画像ソースを含む配列を返します。
この場合、そのオブジェクトが「storyCommentCountNumber」div に含まれる生のテキストを返すようにします。しかし、そのテキストはオブジェクトに含まれているようには見えず、Div の名前だけです。
私は何を間違っていますか?このアプローチは、生のテキストではなく、HTML 要素とその内部のビットを取得するためだけのものであることがわかります。そのdiv内のテキストを取得するにはどうすればよいですか?
ありがとう!