重複の可能性:
PHPでHTMLを解析および処理する方法は?
ページのhtmlをスクラップして、ページの「お問い合わせ」または「お問い合わせ」のURLを見つけることになっているスクリプトに取り組んでいます。だから私が持っているのはURLであり、curlを使用してページのhtmlを取得することができました。
今、私がする必要があるのは、連絡先リンクを見つけて、電子メールアドレスと電話番号を抽出することです。
私の質問は、連絡先のURLをどのように作成するかです。何を探すべきですか?リンクテキストにcontactという単語が含まれている必要がありますか、それともURLにcontactという単語が含まれている必要がありますか?そのための正規表現はどのようになりますか?
次に、連絡先ページができたら、電子メールアドレスと電話番号を抽出する正規表現をオンラインで見つけることができるはずです。だから私は連絡先のリンクを見つける必要があります。私がスクレイピングしているこれらのページはブログです。