python - 「エスケープされた」文字を元の文字に置き換える正規表現

翻译自：https://stackoverflow.com/questions/16866339 2013-05-31T21:33:14.163

4710 次

注：正規表現を使用して、多くのhtmlまたは一般的なhtmlを解析していません。私はそれが悪いことを知っています

TL;DR :

私は次のような文字列を持っています

A sentence with an exclamation\! Next is a \* character

元のマークアップに「エスケープされた」文字がある場所。それらを「オリジナル」に置き換えたいと思います。そして得る：

A sentence with an exclamation! Next is a * character

いくつかの wiki マークアップから抽出する必要がある小さなデータがあります。

ここでは段落/スニペットのみを扱っているので、大きな堅牢なソリューションは必要ありません。Pythonで、テストを試みました：

s = "test \\* \\! test * !! **"

r = re.compile("""\\.""") # Slash followed by anything

r.sub("-", s)

これは次のようにする必要があります:

test - - test * !! **

しかし、それは何もしません。ここで何か不足していますか？

さらに、特定のエスケープ文字を元の文字に置き換える方法がわからないため、次のような特定の正規表現でリストとサブを作成するだけです。

\\\*

と

\\!

おそらくこれを行うためのはるかにクリーンな方法があるので、どんな助けも大歓迎です。

1 に答える 1