私のプロジェクトでは、dom メソッドを使用した Web ページからタグを取得したいと考えています。
しかし、タグは次のように動的に作成できますdocument.write(“<a href=”http://somedomain.com”>”);
ここでは、タグは文字列の形式で指定されるため、正規表現を使用しようとしています。
式が特定の属性も抽出できる必要がある場合、すべてのタグと属性に一致する正規表現が必要です
私のプロジェクトでは、dom メソッドを使用した Web ページからタグを取得したいと考えています。
しかし、タグは次のように動的に作成できますdocument.write(“<a href=”http://somedomain.com”>”);
ここでは、タグは文字列の形式で指定されるため、正規表現を使用しようとしています。
式が特定の属性も抽出できる必要がある場合、すべてのタグと属性に一致する正規表現が必要です
あなたが求めていることを理解するのは非常に難しく、非常に不明確です。
最初に: オプションがある場合は、正規表現を使用して HTML を解析しないでください。シンプルに見えますよね?いいえ、問題は遅かれ早かれ見つかります。
2 番目:デビッドが言ったこと。
ここで、任意の HTML タグに一致する正規表現を示します (まだテストしていないので、必要に応じて最初に試してください)。
\<[^>]*\>
スクリプト タグにも一致することに注意してください (ユーザーがページにタグを書き込まないようにし、必要に応じていくつかをホワイトリストに登録し、ライブラリを使用しない場合に問題が発生するように準備してください)。
たとえば、 RegExrでこれらを試してみてください(ただし、ActionScript 正規表現を使用していることに注意してください。Javascript 正規表現とは異なる場合があります。たとえば、Javascript には先読み/後読みがありません。