1

私はこの問題を抱えています...あなたの誰かがそれを解決する方法を知っているのだろうか?

レッスン名、先生名、教室を分ける必要があります。

Progr.al.Janek ManderÕ 405 Arv.võr.Tom KülaotsÕ 205

プログラム はレッスン名、Janek Mander は教師名、Õ 405 は Classroom です。Arv.võr. はレッスン名、Tom KÜlaots は教師名、Õ 205 は Classroom です。

それらを識別できるように、それらを分離する必要があります...おそらく配列に

info[0] = "Progr.al."
info[1] = "Janek Mander"
info[2] = "Õ 405"

今、私はこの考えを持っています.大文字を検出し、その文字列を #{uppercaseletter} に置き換えることができれば、それを爆発させることができます...Õ 405 すべての教室の前に Õ があるので、Õ で爆発させることができます.

Progrl.al.Janek ManderÕ 405...大文字は 3 文字しかありません...そして、教師の名は常に 2 番目の大文字です...それを自分の利点に使用できる方法はありますか、それとも書き直す必要がありますか?ドムスクリプト?


これまでのコード全体...

<!doctype html>
<html>
<head>
    <title>Ilus tunniplaan</title>
    <style>
        .tund
        {
            width: 140px;
            width: 405px;
            border: 1px solid black;
        }
        .
    </style>
</head>
<body>
<?php
ini_set('error_reporting', E_ALL | E_STRICT);
ini_set('display_errors', 'Off');
ini_set('log_errors', 'Off');

function grab_page( $site )
{
    $ch = curl_init( );
    curl_setopt( $ch, CURLOPT_RETURNTRANSFER, TRUE );
    curl_setopt( $ch, CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT'] );
    curl_setopt( $ch, CURLOPT_TIMEOUT, 40 );
    curl_setopt( $ch, CURLOPT_COOKIEFILE, "cookie.txt" );
    curl_setopt( $ch, CURLOPT_URL, $site );
    ob_start( );
    return curl_exec ( $ch );
    ob_end_clean( );
    curl_close ( $ch );
}

$html = grab_page( "http://web.ametikool.ee/tunniplaan/11.%20n%e4dal%2008.11%20-%2013.11/" );

 $dom = new domDocument; 
    /*** load the html into the object ***/ 
    $dom->loadHTML($html); 

    /*** the table by its tag name ***/ 
    $tables = $dom->getElementsByTagName('table'); 

    /*** get all rows from the table ***/ 
    $rows = $tables->item(0)->getElementsByTagName('tr'); 

    /*** loop over the table rows ***/ 
    foreach ($rows as $row) 
    {
        $id = $id + 1;
        if( $id > 16 )
        {
            /*** get each column by tag name ***/ 
            $cols = $row->getElementsByTagName('td'); 
            /*** echo the values ***/ 
            for ( $counter = 0; $counter <= 9; $counter += 1) 
            {
                $phrase  = $cols->item($counter)->nodeValue;
                echo $phrase . "<br/>\n";
            }
        }
    }
?>
</body>
</html>
4

2 に答える 2

1

トリッキーですが、私はこのようにします: (forループ内)

for ( $counter = 0; $counter <= 9; $counter += 1)
{
    $phrase  = $cols->item($counter);

    $breaklines = $phrase->getElementsByTagName('br');
    if($breaklines->length == 2)
    {
        $br = array();
        for($i=0;$i<2;$i++)
        {
            $br[$i] = $breaklines->item($i);
        }
        //Don't try to put this two for-loops into one.
        for($i=0;$i<2;$i++)
        {
            $phrase->replaceChild($dom->createTextNode('|'), $br[$i]);
        }

        print_r(explode('|',$phrase->nodeValue)) . PHP_EOL;
    }
}
于 2010-11-09T23:38:38.580 に答える
0

入力データの明確なパターンがあれば、正規表現を使用してより良い解決策にアプローチできると思います。

于 2010-11-09T23:09:25.410 に答える