私はメモ帳++を使用しています。そこでは、以下に示す即時重複HTMLタグを見つけて削除する必要があります
実際
<a href="www.google.com"><a href="www.google.com">www.google.com</a></a>
必須
<a href="www.google.com">www.google.com</a>
新しい行にある重複を見つけるための正規表現がありますが、検索は一行で行われます。
助けてください
この種の「二重リンク」には、これを使用できます。
find: <(a [^>]+)>(<\1>.*?</a>)</a>
replace: \2
すべてのタグで次を使用します。
find: <((\w+)[^>]*)>(<\1>.*?</\2>)</\2>
replace: \3
(notepad++ の最新バージョンの 2 つ)
このパターンを試す
(<(\w+)(\s[^>]*)?>)(\s|\n|\t)*\1(.*)(<\/\2>)(\s|\n|\t)*\6
デモ: http://rubular.com/r/RT7ObfV0i8
\1 と \6 を置き換えます