-3

重複の可能性:
PHP で HTML を解析および処理する方法は?

私は file_get_content でページを取得し、これを行うためにページ内のすべてのリンクを抽出したいですか? または、str を start と end phares で使用して、次のようなターゲット文字列を取得できますか:

$str=fdgdfbfbmnlmnjkl njnkhvnbn j<a href="http://www.google.com">google</a>
$link=str($str,"start","END")??????????
EX : $link=str($str,"http://www","com")=Res=>http://www.google.com or google?

また

$str=file_get_content("http://www.google.com");
    $link=str($str,"start","END")??????????
    EX : $link=str($str,"http://www","com")=Res=>http://www.google.com or google?
4

2 に答える 2

1

私はしばらく前に同じ問題を抱えていました。このソリューションは私にとって非常にうまくいきました。

 $string = "Hello World, <a href='http://www.google.com'>Google</a> ! Search also on <a href='http://www.bing.com'>Bing</a>";

 preg_match_all('#\bhttps?://[^\s()<>]+(?:\([\w\d]+\)|([^[:punct:]\s]|/))#', $string, $match);

 $matches = $match[0];

 foreach($matches as $var)
 {    
     print($var."<br>"); 
 }
于 2012-05-28T08:55:33.777 に答える
0

HTML からコンテンツを抽出するには、 DOM メソッドを使用する必要があります。

<?php
    $dom = new DOMDocument;
    $dom->loadHTMLFile('http://www.google.com/');

    $a = $dom->getElementsByTagName('a');
    foreach ($a as $e) {
        echo $e->getAttribute("href") . "\n";
    }
?>
于 2012-05-28T08:52:55.860 に答える