私は正規表現に取り組んでいますが、それを機能させることができません。
このようなテキストで:
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc ultricies congue feugiat.
Tom wrote:
> blablabla
> this is very interesting
> blabla blabla
> I ate a apple yesterday
> this is very interesting
> blabla blabla
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc ultricies congue feugiat.
「Tomwritten:」で始まり、最後の行が「>」で終わるテキスト全体を一致させて、テキストを削除し、2つのloremipsum文のみを取得したいと思います。
はっきりしているのかわからない…
編集:「\ wwritten:」で始まるすべてに一致する正規表現について考えていました。これは、改行とそれに続く「>」ではない文字に一致すると停止します。
Edit2:解決策を見つけました:
\w+ wrote:(\n>[^\n]*)*