特定の Web ページから「リンク」要素を取得しようとしています。私は何が間違っているのか理解できません。次のエラーが表示されます。
重大度: 警告
メッセージ: DOMDocument::loadHTML() [domdocument.loadhtml]: htmlParseEntityRef: エンティティに名前がありません、行: 536
ファイル名: controllers/test.php
ライン番号: 34
コードの 34 行目は次のとおりです。
$dom->loadHTML($html);
私のコード:
$url = "http://www.amazon.com/";
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
if($html = curl_exec($ch)){
// parse the html into a DOMDocument
$dom = new DOMDocument();
$dom->recover = true;
$dom->strictErrorChecking = false;
$dom->loadHTML($html);
$hrefs = $dom->getElementsByTagName('a');
echo "<pre>";
print_r($hrefs);
echo "</pre>";
curl_close($ch);
}else{
echo "The website could not be reached.";
}