0

URL があり、その URL 内で連絡先リンクを見つける必要があります。

だから私がしたことは、simple_html_dom.php を使用してすべての a タグをループし、「contact」または「advertis」という単語が含まれている場合、それは連絡先の URL です。しかし、これは実際には非常に遅いです。

だから私が今したいのは、curlを使用してページをスクレイピングし(将来的にはマルチカールでも問題ありません)、リンクに「連絡先」または「広告」が含まれている場合、スクレイプ結果aa hrefリンク内で正規表現を見つけようとすることです.

私は preg_match_all を使用しますが、正規表現は何でしょうか?

4

1 に答える 1

1
preg_match_all('/\<a href\=\"(.*?(contact|advertis)+.*?)\"\>(.+?)\<\/a>/m', $page, $matches);
于 2012-12-11T22:30:47.233 に答える