python - Python で正規表現を使用して頭字語を検索する

Question

Python で正規表現を使用して、ピリオドで区切られた頭字語を一致させようとしています。次のコードがあります。

import re
test_string = "U.S.A."
pattern = r'([A-Z]\.)+'
print re.findall(pattern, test_string)

この結果は次のとおりです。

['A.']

なぜこのような結果になったのか不思議です。+ が貪欲であることは知っていますが、[AZ]\ が最初に出現するのはなぜですか。無視？

score 4 · Accepted Answer

説明

この正規表現は次のようになります。

(?:(?<=\.|\s)[A-Z]\.)+

ここに画像の説明を入力

サンプルテキスト

This is the U.S.A. we have RADAR.

マッチ

U.S.A

score 3 · Accepted Answer

(...)in regex はグループを作成します。次のように変更することをお勧めします。

pattern = r'(?:[A-Z]\.)+'