javascript - document.evaluate 正規表現

Question

href 属性を持つすべての「a」要素を次の形式で取得したい: http(s)://any.example.com ここで、any は文字や数字のみを含む文字列にすることができます。私は正規表現とXPathが初めてなので、正しく理解できません。正規表現を理解しましたが、100% 正しいかどうかはわかりません: コード:

/(http|https)://+[A-Za-z0-9]+\.example+\.+com/

したがって、XPath は次のようになります。コード:

document.evaluate( "//a[@href='/(http|https)://+[A-Za-z0-9]+\.google+\.+com/']" , document , null , XPathResult.ORDERED_NODE_SNAPSHOT_TYPE , null );

しかし、うまくいきません。

誰かが私を助けてくれれば幸いです。

score 1 · Accepted Answer

現在、ブラウザーは現在 XPATH 2 をサポートしていないようです。属性に対する正規表現の適用は、XPATH 2.0 でのみサポートされています。

XPATH 1.0 (正規表現なし) を使用して要素をフィルタリングした後に正規表現を適用し、要素を反復処理して、代わりに JS レベルの正規表現を使用して要素をさらにフィルタリングします。

参考文献:

score 0 · Accepted Answer

あなたの正規表現は少しずれており、過度に複雑です。
これを試して：

https?://[A-Za-z0-9]+\.example\.com/

javascript - document.evaluate 正規表現

2 に答える 2

Related

Reference