したがって、次のリンク構造をphpのpreg_match_allと一致させたいと思います。
<a garbage href="http://this.is.a.link.com/?query=this has invalid spaces" possible garbage>
<a garbage href='http://this.is.a.link.com/?query=this also has has invalid spaces' possible garbage>
<a garbage href=http://this.is.a.link.com/?query=no_spaces_but_no_delimiters possible garbage>
<a garbage href=http://this.is.a.link.com/?query=no_spaces_but_no_delimiters>
"と'deilmitedurlsを1つ取得できます
'#<a[^>]*?href=("|\')(.*?)("|\')#is'
または、3つすべてを取得できますが、最初の2つに次のスペースがある場合は取得できません。
'#<a[^>]*?href=("|\')?(.*?)[\s\"\'>]#is'
潜在的なスペースで区切られた「」と「」だけでなく、区切り文字なしで適切にエンコードされたURLも取得するように、これをどのように定式化できますか。