python - Python 正規表現の問題

Question

特定の文字列が個々の文字に続くまで、一連の文字を返すように re モジュールを使用しようとしています。re documentation は、これを達成するために (?!...) を使用できることを示しているようです。私が現在取り組んでいる例：

str_to_search = 'abababsonab, etc'
first = re.search(r'(ab)+(?!son)', str_to_search)
second = re.search(r'.+(?!son)', str_to_search)

first.group() は「abab」です。これが私が目指しているものです。ただし、次の「b」の直後に「son」が続くため、「ababa」で停止させようとしているにもかかわらず、second.group() は str_to_search 文字列全体を返します。どこが間違っていますか？

score 2 · Accepted Answer

単純なことではありませんが、「'son' が続かない文字」の繰り返しシーケンスをキャプチャできます。この繰り返される式は、非キャプチャグループ (?: ... ) 内にある必要があるため、一致結果が混乱することはありません。(余分なマッチグループになってしまいます)

これを試して：

import re

str_to_search = 'abababsonab, etc'
second = re.search(r'(?:.(?!son))+', str_to_search)
print(second.group())

出力：

ababa

こちらをご覧ください: http://ideone.com/6DhLgN

score 1 · Accepted Answer

これはうまくいくはずです：

second = re.search(r'(.(?!son))+', str_to_search)
#output: 'ababa'

score 0 · Accepted Answer

あなたが何をしようとしているのかわからない

3 に答える 3