4

CRON ジョブで毎分実行する PHP ページがあります。

かなり長い間実行していましたが、突然これらのエラーが発生し始めました。

Maximum execution time of 30 seconds exceeded in /home2/sharingi/public_html/scrape/functions.php on line 84

行番号はエラーごとに異なり、70 行目から 90 行目までの範囲です。

0行から95行までのコードは次のとおりです

function crawl_page( $base_url, $target_url, $userAgent, $links)
{
    $ch = curl_init();

    curl_setopt($ch, CURLOPT_USERAGENT, $userAgent);
    curl_setopt($ch, CURLOPT_URL,$target_url);
    curl_setopt($ch, CURLOPT_FAILONERROR, false);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
    curl_setopt($ch, CURLOPT_AUTOREFERER, true);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER,true);
    curl_setopt($ch, CURLOPT_TIMEOUT, 100);
    curl_setopt($ch, CURLOPT_MAXREDIRS, 10); //follow up to 10 redirections - avoids loops

    $html = curl_exec($ch);

    if (!$html) 
    {
        echo "<br />cURL error number:" .curl_errno($ch);
        echo "<br />cURL error:" . curl_error($ch);
        //exit;
    }

    //
    // load scrapped data into the DOM
    //

    $dom = new DOMDocument();
    @$dom->loadHTML($html);

    //
    // get only LINKS from the DOM with XPath
    //

    $xpath = new DOMXPath($dom);
    $hrefs = $xpath->evaluate("/html/body//a");

    //
    // go through all the links and store to db or whatever
    //  

    for ($i = 0; $i < $hrefs->length; $i++) 
    {
        $href = $hrefs->item($i);
        $url = $href->getAttribute('href');

        //if the $url does not contain the web site base address: http://www.thesite.com/ then add it onto the front

        $clean_link = clean_url( $base_url, $url, $target_url);
        $clean_link = str_replace( "http://" , "" , $clean_link);
        $clean_link = str_replace( "//" , "/" , $clean_link);

        $links[] = $clean_link;

        //removes empty array values

        foreach($links as $key => $value) 
        { 
            if($value == "") 
            { 
                unset($links[$key]); 
            } 
        } 
        $links = array_values($links); 

        //removes javascript lines

        foreach ($links as $key => $value)
        {
            if ( strpos( $value , "javascript:") !== FALSE )
            {
                unset($links[$key]);
            }
        }
        $links = array_values($links);

        // removes @ lines (email)

        foreach ($links as $key => $value)
        {
            if ( strpos( $value , "@") !== FALSE || strpos( $value, 'mailto:') !== FALSE)
            {
                unset($links[$key]);
            }
        }
        $links = array_values($links);
    }   

    return $links; 
}

これらのエラーの原因は何ですか?どうすれば回避できますか?

4

2 に答える 2

5

set_time_limit関数を使用して max_execution 時間を設定する必要があります。無限の時間が必要な場合 (ほとんどの場合)、次を使用します。

set_time_limit(0);
于 2009-11-10T05:29:16.730 に答える
0

原因: 一部の機能は、完了するまでに 30 秒以上かかります。 解決策: PHP構成ファイルで
最大実行時間 ( max_execution_time ) を増やします。
1. グローバル php.ini ファイル (通常は /web/conf にあります。それ以外の場合は、phpinfo の構成ファイル (php.ini) パスから場所を取得できます) にアクセスできる場合は、max_execution_time=30 をmax_execution_time=300 に変更します。
2. ローカルの php.ini ファイルにしかアクセスできない場合 (場所は phpinfo の Loaded Configuration File から取得できます)、max_execution_time=30 を max_execution_time=300 に変更します。注 : このファイルの名前は、php 5.x+では php5.ini 、4.x では php.ini です。

于 2012-10-14T23:51:02.360 に答える