python - 最後の出現を正規表現と一致させる

Question

正規表現を使用してパターンの最後の出現を照合したいと思います。

このように構成されたテキストがあります：

Pellentesque habitant morbi tristique senectus et netus et
lesuada fames ac turpis egestas. Vestibulum tortor quam, feugiat vitae
ultricies eget, tempor sit amet, ante. Donec eu libero sit amet quam
egestas <br>semper<br>tizi ouzou<br>Tizi Ouzou<br>

 私の場合 Tizi Ouzou 、2つの間の最後のテキスト、理想的にはTizi Ouzou文字列を一致させたい

最後の後にいくつかの空白があることに注意してください 

私はこれを試しました：

<br>.*<br>\s*$

ただし、最初 から最後まですべてを選択します。

NB: 私は Python を使用しており、正規表現をテストするためにpythexを使用しています

score 13 · Accepted Answer

組み込み関数を使用した非正規表現アプローチstr:

text = """
Pellentesque habitant morbi tristique senectus et netus et
lesuada fames ac turpis egestas. Vestibulum tortor quam, feugiat vitae
ultricies eget, tempor sit amet, ante. Donec eu libero sit amet quam
egestas <br>semper<br>tizi ouzou<br>Tizi Ouzou<br>       """

res = text.rsplit('<br>', 2)[-2]
#Tizi Ouzou

score 7 · Accepted Answer

関連する質問を見てください: HTML を regex で解析すべきではありません。代わりに正規表現パーサーを使用してください。Python の場合は、 Beautiful Soupが最適だと聞きました。

とにかく、正規表現でやりたい場合は、が.*別のを通過できないことを確認する必要があります 。そのために、各文字を消費する前に先読みを使用して、別の文字を開始しないようにすることができ ます。

<br>(?:(?!<br>).)*<br>\s*$

score 6 · Accepted Answer

文字クラスを減らして貪欲な量指定子を使用できます (あなたの間にタグがないと仮定します ):

<br>([^<]*)<br>\s*$

また

<br>((?:[^<]+|<(?!br>))*)<br>\s*$

内部にタグを許可します。

検索する文字列が含まれていTizi Ouzouないため 、最初のキャプチャグループを抽出できます。

score 4 · Accepted Answer

[^<>]*代わりにどうですか.*：

import re


text = """Pellentesque habitant morbi tristique senectus et netus et
lesuada fames ac turpis egestas. Vestibulum tortor quam, feugiat vitae
ultricies eget, tempor sit amet, ante. Donec eu libero sit amet quam
egestas <br>semper<br>tizi ouzou<br>Tizi Ouzou<br> """


print re.search('<br>([^<>]*)<br>\s*$', text).group(1)

版画

Tizi Ouzou

score 3 · Accepted Answer

試す：

re.match(r'(?s).*<br>(?=.*<br>)(.*)<br>', s).group(1)

最初に最後まですべてのデータを消費し、その後に 別のデータがあることを先読みで確認するまでバックトラックし、それらの間のコンテンツを抽出します。 

次の結果が得られます。

Tizi Ouzou

編集：先読みする必要はありません。m.buettnerのコメントに基づく代替 (同じ結果)

re.match(r'(?s).*<br>(.*)<br>', s).group(1)

python - 最後の出現を正規表現と一致させる

6 に答える 6

Related

Reference