1

注:正規表現を使用して、多くのhtmlまたは一般的なhtmlを解析していません。私はそれが悪いことを知っています

TL;DR :

私は次のような文字列を持っています

A sentence with an exclamation\! Next is a \* character

元のマークアップに「エスケープされた」文字がある場所。それらを「オリジナル」に置き換えたいと思います。そして得る:

A sentence with an exclamation! Next is a * character

いくつかの wiki マークアップから抽出する必要がある小さなデータがあります。

ここでは段落/スニペットのみを扱っているので、大きな堅牢なソリューションは必要ありません。Pythonで、テストを試みました:

s = "test \\* \\! test * !! **"

r = re.compile("""\\.""") # Slash followed by anything

r.sub("-", s)

これは次のようにする必要があります:

test - - test * !! **

しかし、それは何もしません。ここで何か不足していますか?

さらに、特定のエスケープ文字を元の文字に置き換える方法がわからないため、次のような特定の正規表現でリストとサブを作成するだけです。

\\\*

\\!

おそらくこれを行うためのはるかにクリーンな方法があるので、どんな助けも大歓迎です。

4

1 に答える 1