2

私はこのコードを持っています:

import re
#TEST CASES
match_dict = ['hello(here)',
             'Hello   (Hi)',
             "'dfsfds Hello (Hi) fdfd' Hello (Yes)",
             "Hello ('hi)xx')",
             "Hello  ('Hi')"]
for s in match_dict:
    print "INPUT: %s" % s
    m = re.sub(r"(?<!\()'[^']+'", '', s, flags=re.M)
    paren_quotes = re.findall(r"Hello\s*\('([^']+)'\)", m, flags=re.M)
    output = paren_quotes if paren_quotes else []
    m = re.sub(r"Hello\s*\('[^']+'\)", '', m, flags=re.M)
    paren_matches = re.findall(r"Hello\s*\(([^)]+)\)", m, flags=re.M)
    if paren_matches:
        output.extend(paren_matches)
    print 'OUTPUT: %s\n' % output

このコードは、'Hello' の後の括弧内をすべて出力するように作成されています。

Hello (Hi)  would give 'Hi'

私の問題は、私が入れたときです:

Hello('Hi')    

…返し'Hi' てほしいときはまだ返してくれる"'Hi'"

このコードを修正する方法を知っている人はいますか?

4

2 に答える 2

5

貪欲でないマッチングを使用するだけです:

matches = re.search(r'^Hello\s*\((.*?)\)', text)
于 2012-05-19T01:56:14.907 に答える
2
>>> import re
>>> p = re.compile(r'Hello\s*\((.*?)\)', re.M)
>>> m = p.findall("Hello  ('Hi')")
>>> print m
["'Hi'"]
>>> m = p.findall("'dfsfds Hello (Hi) fdfd' Hello (Yes)")
>>> print m
['Hi', 'Yes']
于 2012-05-19T02:03:47.943 に答える