1

スペースとピリオドの両方を許可する正規表現を使用して、python スクレーパーを作成しようとしています。

特定のサイトから野球チームの名前を取得しようとしているため、一部はMiami(完全な単語) ですが、他はSan Francisco(スペース付き) であり、他はChi. Cubs(ピリオドとスペース) です。

都市名の前のパターンと後のパターン名を知っています。文字、スペース、ピリオドの数に関係なく、すべてに一致するものを見つけようとしています。私は正規表現を使用したいと思いますが、別のライブラリを使用する方が簡単であれば、私はそれを受け入れます。

4

1 に答える 1

2

以下は、任意の数のスペース、ピリオド、または文字に一致する正規表現です。

[ .a-zA-Z]+

例:

>>> re.search(r'[ .a-zA-Z]+', 'Miami').group(0)
'Miami'
>>> re.search(r'[ .a-zA-Z]+', 'San Francisco').group(0)
'San Francisco'
>>> re.search(r'[ .a-zA-Z]+', 'Chi. Cubs').group(0)
'Chi. Cubs'
于 2012-06-13T22:33:49.097 に答える