0

こんにちは、正規表現のコツをつかもうとしています。この Web サイトからコンテンツを抽出しようとしていますが、配列に何も追加できないため、正規表現に問題があると思います。誰かが私を正しい方向に向けることができますか、それはほんの小さなことだと思います。

ありがとう

<?php   
    $f1 = fopen("http://www.irishexaminer.com/","r");
    $document = fread($f1,100000);
    fclose($f1);
    $regexp = "%<p>(.+)</p><p>%";
    preg_match($regexp,$document,$getHeading);  
    echo "<br>" . $getHeading[1];
    echo '<pre>';
    print_r($getHeading);
    echo '</pre>';
?>
4

1 に答える 1

1

あなたの場合、 p の終了タグに空白の言い訳はありません。

<p> THERE is no excuse for loyalist violence on the streets of Belfast.<p /><p>

一致する正規表現

%<p>(.+)</\s*p><p>%

正規表現を HTML に十分対応できるようにするには、しばらく時間がかかります。フランキーのアドバイスも受けてください。失敗しにくいことに力を注ぎましょう。PHP HTML Tidyを使用できます

于 2013-01-10T16:33:09.297 に答える