特定のページのリンクをチェックするスクリプトを使用しています。単純な html DOM を使用して、情報を配列に解析しています。すべての a タグの href をチェックして、ファイルまたは # や JS などのものが含まれているかどうかを確認する必要があります。
成功せずに次のことを試しました。
if(preg_match("|^(.*)|iU", $href)){
save_link();
}
私のパターンが間違っているか、この機能を完了するためのより良い方法があるかどうかはわかりません。
$href に .com .php .file 拡張子が含まれているかどうかを検出できるようにしたいと考えています。このようにして、 # "function()" などのアイテムや、href 属性で使用されるその他のアイテムを除外します。
編集: parse_url は機能せず、投稿を停止します。値 # は、上記のように有効な URL として返されます。