r'#\w+'
ツイートから一連のハッシュタグ ( ) を蓄積できるように正規表現をコンパイルしようとしています。ツイートの開始と終了からこれを実行できる 2 つの正規表現をコンパイルできるようにしたいと考えています。私はpython 272を使用していますが、コードは次のようになります。
HASHTAG_SEQ_REGEX_PATTERN = r"""
( #Outermost grouping to match overall regex
#\w+ #The hashtag matching. It's a valid combination of \w+
([:\s,]*#\w+)* #This is an optional (0 or more) sequence of hashtags separated by [\s,:]*
) #Closing parenthesis of outermost grouping to match overall regex
"""
LEFT_HASHTAG_REGEX_SEQ = re.compile('^' + HASHTAG_SEQ_REGEX_PATTERN , re.VERBOSE | re.IGNORECASE)
正規表現をコンパイルしている行が実行されると、次のエラーが発生します。
sre_constants.error: unbalanced parenthesis
正規表現パターンに見られる不均衡な括弧がないため、なぜこれが得られるのかわかりません。