正規表現を使用して、xml から文字列をキャプチャしています。入力テキストは、ノードの innerText に分割されます。正規表現が何かに一致する場合、その xpath も知りたいです。例えば、
<root>
<node>aabb</node>
<node>bcccd</node>
</root>
「([a-zA-Z])\1{2}」をキャプチャしたいのですが、2 つの結果が得られます --((bb,/*[1]/*[1]) (b,/*[1 ]/*[2])) および (ccc,/*[1]/*[2])。
現在、正規表現を段階的に実行する方法を見つけようとしています。誰かがそれを達成する方法を知っていますか、またはいくつかの回避策や良いアイデアがあるかどうか.