cURLを使用して取得したページで1回だけ発生する文字列を削除しようとしています。例:
<h3 class=" ">STRING IN QUESTION</h3>
また
<h3 class="active">STRING IN QUESTION</h3>
また
<h3 class=" active">STRING IN QUESTION</h3>
リソースをあまり消費しない方法で実行できない限り、preg_matchを使用してこれを実行したいと思います。
これが私が使用している正規表現で、結果はゼロです。
<h3\sclass="\s">(.*?)</h3>
編集:
これが実際のコードです(動的なものの代わりにここで使用される実際のURL)-cURLを介してプルされた場合、クラス属性は存在しませんが、示されているように機能しないことがわかりました:
$ch = curl_init ("URL IN QUESTION");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$page = curl_exec($ch);
preg_match('<h3>(.*?)</h3>', $page, $match);
print_r($match);
何も印刷しない