テキストの一部が次のように区切られているテキストがあります。
{# xxx #} some text {# zzz #}
私のテキスト全体で、このパターンの多くの出現があります。some text
区切り文字からを抽出したいと思います。正規表現でこれを行うにはどうすればよいですか?
たとえば、次のテキストがあるとします。
Lorem Ipsum は、印刷および植字業界の単なるダミー テキストです。Lorem Ipsum は 1500 年代以来、業界標準のダミー テキストでした。未知の印刷業者が活字のギャレーを取り、{# xxx #} をスクランブルして {# zzz #} を活字見本にしました。それは 5 世紀だけでなく、電子植字への飛躍にも耐え、本質的に変わっていません。1960 年代に {# xxx #}、{# zzz #} Lorem Ipsum のパッセージを含む Letraset シートがリリースされ、最近では {# xxx #} Aldus PageMaker {# zzz #} のバージョンを含むデスクトップ パブリッシング ソフトウェアで普及しました。ロレム・イプサム。
次のようなリストを取得したいと思います。
[it to make, with, desktop publishing software like Aldus PageMaker]
これが私の非動作コードです:
>>> regex = re.compile(r'{# xxx #}.*({# zzz #}).*?')
>>> re.findall(regex, s) {# zzz #}
私の困難は、貪欲でない方法で正規表現を作成しようとしていると思いますか?