HTMLソースからURLのリストのテキストhref
を抽出するための正規表現を作成しようとしています。テキストは任意の値にすることができますanchor
。anchor
HTML部分は次のようになります。
<div class="links"><a rel="nofollow" target="_blank" href="http://url1.com" class="get-all">URL1</a><a rel="nofollow" target="_blank" href="http://url2.com" class="get-all">This is Url-2</a><a rel="nofollow" target="_blank" href="http://url3.com" class="get-all">This is Url-3</a><a rel="nofollow" target="_blank" href="http://url4.com" class="get-all">Sweet URL 4</a></div>
次の正規表現を試しましたが、</a>
タグの前のすべてを取得して失敗するため、機能しません。
preg_match_('/<a rel="nofollow" target="_blank" href="(.*)" class="see-all">(.*)<\/a>/', $source , $website_array);
必要なデータを抽出するために機能する正規表現は何でしょうか?