注:正規表現を使用して、多くのhtmlまたは一般的なhtmlを解析していません。私はそれが悪いことを知っています
TL;DR :
私は次のような文字列を持っています
A sentence with an exclamation\! Next is a \* character
元のマークアップに「エスケープされた」文字がある場所。それらを「オリジナル」に置き換えたいと思います。そして得る:
A sentence with an exclamation! Next is a * character
いくつかの wiki マークアップから抽出する必要がある小さなデータがあります。
ここでは段落/スニペットのみを扱っているので、大きな堅牢なソリューションは必要ありません。Pythonで、テストを試みました:
s = "test \\* \\! test * !! **"
r = re.compile("""\\.""") # Slash followed by anything
r.sub("-", s)
これは次のようにする必要があります:
test - - test * !! **
しかし、それは何もしません。ここで何か不足していますか?
さらに、特定のエスケープ文字を元の文字に置き換える方法がわからないため、次のような特定の正規表現でリストとサブを作成するだけです。
\\\*
と
\\!
おそらくこれを行うためのはるかにクリーンな方法があるので、どんな助けも大歓迎です。