私は次のコードを持っています。URL内に/movie/があるa href titlesのみを取得したい。
function get_a_contentmovies(){
$h1count = preg_match_all("/(<a.*>)(\w.*)(<.*>)/ismU",$this->DataFromSite,$patterns);
return $patterns[2];
}
私は次のコードを持っています。URL内に/movie/があるa href titlesのみを取得したい。
function get_a_contentmovies(){
$h1count = preg_match_all("/(<a.*>)(\w.*)(<.*>)/ismU",$this->DataFromSite,$patterns);
return $patterns[2];
}
次のようにDOMXpathを使用できます。
$dom = new DomDocument();
$dom->loadHTML($string);
$xpath = new DOMXpath($dom);
$elements = $xpath->query("//a[contains(@href, '/movie/')]");
foreach($elements as $el) {
var_dump($el->getAttribute('title'));
}
Regex を使用して (x)HTML を解析するのは悪い考えです。DomDocumentなどの DOM パーサーを使用する必要があります。このトピックを見てください。