phpライブラリsimple_html_domを使用して、URLのリストをdomとしてループしています。これらのそれぞれについて、文字列を見つけようとします。見つかった場合は、URLを配列に保存します。それ以外の場合は、次のサイクルに進み、urls配列を返します。最後に。スクリプトは、URLごとに数秒程度かかります。いくつかのループの後、スクリプトがファイル内の$ dom-> load($ url)行でスタックし、htmlがセグメンテーション違反をスローします。ループの数はURLリストによって異なります。ループスクリプトがスタックしているURLでのみ動作するテストスクリプトでload($ url)の呼び出しを分離しようとしましたが、テストスクリプトはエラーなしで終了します(ただし、domのprint_rを確認できません。ページソースを表示しようとすると、Firefoxがクラッシュします)。私はLAMPサーバーに取り組んでいます。コードは次のとおりです。
error_reporting(E_ALL);
ini_set("max_execution_time", "300");
ini_set("memory_limit", "512M");
ini_set('output_buffering', 0);
ini_set('implicit_flush', 1);
ob_end_flush();
ob_start();
set_time_limit(100);
$urlArray = array();
foreach($urlArray as $url){
$found = false;
$dom = file_get_html($url);
foreach(( $dom->find('target')) as $caught){
array_push($link, $caught);
$found = true
}
if($trovato){
return $link;
}else{
echo "not found";
}
}
助けのためのthx