重複するタグを含む可能性のある生成された HTML 文字列があり、それらを見つけて HTML を有効にしようとしています。文字列の形式は次のとおりです (例: 重複するタグ、次にネストされたタグ):
<tag_1> xx <tag_2> xx </tag_1> xx </tag_2> xx <tag_1> xx <tag_3> xx </tag_3> </tag_1>
だけ抽出したい<tag_1> xx <tag_2> xx </tag_1>
ではない
<tag_1> xx <tag_3> xx </tag_3> </tag_1>
-
現在、私の正規表現は両方のケースに一致します。
タグ名への後方参照(\ 1)を貪欲に一致させない正規表現が必要だと仮定しています...ここに私が持っているものがありますが、最後の部分がわかりません。それはjavascriptで可能ですか?
/<tag_([A-Z0-9]*)\b[^>]*>.*?<tag.*?<\/tag_\1>/gi;
ありがとう