Webページからデータをスクレイピングしようとしています。Web ページは任意のページにすることができます。たとえば、をhttp://www.google.com/
使用してスクレイピングしてcurl
います。非常に多くの警告が表示され、何もしません。警告は 30 行目にあります。
警告: SimpleXMLElement::__construct(): in C:\wamp\www\nbacurl\index.php
そして、このエラーが数回繰り返されました。
simplehtmldom について聞いたので、ダウンロードしましたが、使い方がわかりません。解析するページがありますが、抜け道が見つかりません。これは機能しない非常に単純なコードです。
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'http://www.google.com' );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$contents = curl_exec ($ch);
$xml = new SimpleXMLElement($contents);
echo '<pre>' , print_r($xml) , '</pre'>;