python - 正規表現：貪欲と非貪欲の両方のブラケットに一致

Question

私はpython正規表現モジュールを使用していますre.

この 2 つのフレーズの '(' ')' 内のすべてを一致させる必要がありますが、「それほど貪欲ではありません」。このような：

show the (name) of the (person)

calc the sqrt of (+ (* (2 4) 3))

結果は、フレーズ 1 から返されます。

name
person

フレーズ 2 から結果が返されます。

+ (* (2 4) 3)

問題は、最初のフレーズに合わせるために、私が使用したことです'\(.*?\)'

これは、2番目のフレーズで、ぴったりです+ (* (2 4)

そして'\(.*\)'、2番目のフレーズを正しく適合させるために使用すると、最初のフレーズが適合します(name) of the (person)

両方のフレーズで正しく機能する正規表現は何ですか?

score 7 · Accepted Answer

Pyparseを使用すると、次のような単純な 1 回限りのパーサーを簡単に作成できます。

>>> text = """show the (name) of the (person)
...
... calc the sqrt of (+ (* (2 4) 3))"""
>>> import pyparsing
>>> for match in pyparsing.nestedExpr('(',')').searchString(text):
...   print match[0]
...
['name']
['person']
['+', ['*', ['2', '4'], '3']]

ネストされた括弧が破棄され、ネストされたテキストがネストされた構造として返されることに注意してください。

各括弧ビットの元のテキストが必要な場合は、originalTextFor 修飾子を使用します。

>>> for match in pyparsing.originalTextFor(pyparsing.nestedExpr('(',')')).searchString(text):
...   print match[0]
...
(name)
(person)
(+ (* (2 4) 3))

score 0 · Accepted Answer

あなたがやろうとしていることは、操車場のように見えます（実際には、LISPのように見えるので、PyLispをチェックする必要があります）。これらの種類の式を解析するために正規表現を使用する必要はありません。

操車場の記事@ウィキペディアを参照してください。これはPythonの実装です。

score 0 · Accepted Answer

これは、必要なすべての情報に一致します。

(?:\()(.*?\){2})|(?:\()(.*?)(?:\))

グループ 1 = + (* (2 4) 3)

最後の ")" は .strip(')') で取り除くことができます

グループ 2 =名前、人物

score -3 · Accepted Answer

ブラケットがネストされていない限り、遅延正規表現を使用できます。

\(.*?\)

理論的には、正規表現の限られた量のネストを解析できますが、それは非常に困難であり、努力する価値はありません。カスタム python 関数を使用する方がはるかに簡単です。良い説明については、この回答を参照してください。

python - 正規表現：貪欲と非貪欲の両方のブラケットに一致

4 に答える 4

Related

Reference