正規表現を「*」に置き換えたいのですが、正規表現が <> の外側にある場合のみです。全体のポイントは、html タグに干渉しないことです。
これを使用して置き換えます:
re.sub(r'SOMEREGEX(?=[^>]*(<|$))', '*', line)
しかし、私は彼の問題に遭遇しました:私の正規表現が次の場合:
f.*k
次に、これ:
fzzzzzzzzz<HTMLTAG>zzzzzzzk
私が望まない「*」になるでしょう。この問題を解決するにはどうすればよいですか?
制約:
-すべてのブラケットが一致しています
-ネストされたブラケットなし
-SOMEREGEX はユーザーによって提供されます。私はそれを変更しない方が好きです。