PHP Simple HTML DOMパーサーを使用して、<h1>
さまざまなWebページの最初のタグのコンテンツを取得しています。スクリプトはほとんどの場合うまく機能しますが、一部のWebページでは、私のスクリプトは「ハングアップ」します。以下にリストしたものの後に続くコードを完了せずに、スクリプトが停止します。動作しないページのソースを調べましたが、<h1>
またはその内容については特に違いはありません。考えられるすべてのURLでこれを機能させる方法はありますか?そうでない場合は、機能しないURLでハングアップしないようにスクリプトを修正するにはどうすればよいですか?
include_once( 'simple_html_dom.php');
$html = file_get_html($webpage);
$element = $html->find('h1', 0);
$element = strip_tags($element);