2

解析できるように、一部のテキストから wiki の書式設定を削除しようとしています。

2 つの区切り文字 ('[[' と ']]') の間のすべてのテキストを削除する最も Pythonic な方法は何ですか? 指定された文字列には、複数の区切り文字ペアが含まれます。

4

1 に答える 1

14

正規表現は問題にぴったりです。

>>> import re
>>> input_str = 'foo [[bar]] baz [[etc.]]'

全体を削除したい場合[[...]]、それはあなたが求めていることだと思います、

>>> re.sub(r'\[\[.*?\]\]', '', input_str)
'foo  baz '

の内容を残したい場合は[[...]]

>>> re.sub(r'\[\[(.*?)\]\]', r'\1', input_str)
'foo bar baz etc.'
于 2012-06-16T00:38:59.560 に答える