これは私の正規表現です:
(?P=<streetname>[a-zæøå ]+)(?:[ ]+)(?P=<housenumber>\d+)(?:[ ]+),(?:[ ]+)(?P=<postalcode>\d{1,4})(?:[ ]+)(?P=<city>[a-zæøå ]+)
すべてのグループ名にASCII文字のみが含まれているのに、なぜエラーが発生するのでしょうか。
トレースバック(最後の最後の呼び出し): ファイル"addrtools.py"、46行目 主要() ファイル"addrtools.py"、43行目、メイン extract_address('Testaddress 15B、1234 Oslo') extract_addressのファイル「addrtools.py」、35行目 match = re.match(pat_full、string) ファイル"/Users/tomas/.pythonbrew/pythons/Python-2.7.3/lib/python2.7/re.py"、137行目、一致 return _compile(pattern、flags).match(string) ファイル"/Users/tomas/.pythonbrew/pythons/Python-2.7.3/lib/python2.7/re.py"、242行目、_compile エラーを発生させる、v#式が無効 sre_constants.error:グループ名の文字が正しくありません
pat_full
確かに上記の正規表現が含まれていることを確認しました。また、私のドキュメントはUTF-8でエンコードされており、UTF-8モードに設定されています(# --*-- Encoding: UTF-8 --*--
)。