1

データを受信したい Web サイトに PHPCrawl を使用していますが、(たとえば) 特定のクラスを持つスパンからデータを取得することをどこから始めればよいかわかりません。

例ごとに、このスパンから「Jan」という名前を取得したいと思います。

 <span class="firstname">Jan</span>

DOMDocument() と DOMXPath() を使用してみましたが、html 文字列をロードするときにエラーが発生します。

だからここに私がこれまで持っていたものがあります:

 $doc = new DOMDocument();
 $doc->loadHTML($PageInfo->content);
 $xpath = new DOMXPath($doc);

 foreach ($xpath->query("//span[@class='family-name']") as $node) {
     echo "Family name: " . $node . "\n";
 }

ただし、これを使用すると、次のようなエラーが発生します。

PHP Notice:  DOMDocument::loadHTML(): Namespace prefix g is not defined in Entity, line: 294 in /var/www/crawl/www/crawl.php on line 30
PHP Warning:  DOMDocument::loadHTML(): Tag g:plusone invalid in Entity, line: 294 in /var/www/crawl/www/crawl.php on line 30

HTMLコードを変更できないため(これはPHPCrawlによって抽出されます)、何か他のことをする必要があります。しかし、私は何を知りません。PHPCrawl 自体にそのためのツールはありますか?

4

0 に答える 0