<a>
href 属性のみを含む開始タグに一致する正規表現を作成したいと思います。
<a href="doesntmatter.com">
上記と一致する必要がありますが、他の属性が追加された場合は一致しません。
<a href="doesntmatter.com" onmouseover="alert('Do something evil with Javascript')">
通常、これは非常に簡単ですが、HTML はエンコードされています。したがって、上記の両方をエンコードするには、これと一致する正規表現が必要です。
<a href="doesntmatter.com" >
しかし、これと一致しません:
<a href="doesntmatter.com" onmouseover="alert('do something evil with javascript.')" >
エンコードされたすべての HTML が「有効」であると仮定し (奇妙で不正な形式の XSS トリックがない)、HTML サニタイズのベスト プラクティスに従う必要はないと仮定します。上記の A) に一致するが B) には一致しない最も単純な正規表現が必要なだけです。
ありがとう!