<a>
Web サイトの送信タグをすべて検索して表示する簡単なスクリプトを作成しました。
これを行うには、最初にサイトマップをスクレイピングし、それらの URL を配列に入れます。次に、URL をループして各 URL をスクレイピングし、個別にタグを探し<a>
ます。次に、見つかった各タグを実行strpos()
して、無視したい URL があるかどうかを確認します。
スクリプトの完了 (ローカルでの実行) には約 5 分 (500 ページのスクレイピング) かかります。現時点で私が使用している
//SEES IF URL CONTAINS EXCLUDED PARAM
function find_excluded_url ($match_url) {
return strpos($match_url, "mydomain.co.uk") ||
strpos($match_url, "tumblr.com") ||
strpos($match_url, "nofollow") ||
strpos($match_url, "/archive") ||
strpos($match_url, "page/2");
}
次に、使用して結果を表示するには
if ( find_excluded_url($element) == false ) {
echo "<a href='$element->href'>" . $element->href . "</a>";
}
これを達成するためのよりパフォーマンスの高い方法はありますか?
これが非常に明白な質問である場合は申し訳ありませんが、これは私がPHPで構築した最初の本物です