c# - 奇妙な正規表現の動作 - 最初と最後のキャプチャグループのみに一致します

Question

コンマ区切りの単語リストに一致し、すべての単語をキャプチャする正規表現を作成しようとしています。この行は一致する必要があり、 apple , banana ,orange,peanut キャプチャは、、、、である必要があります。そのために、次の正規表現を使用します。applebananaorangepeanut

^\s*([a-z_]\w*)(?:\s*,\s*([a-z_]\w*))*\s*$

文字列との一致に成功しましたが、突然キャプチャされましたapple。peanutこの動作は、C# と Perl の両方で見られます。したがって、正規表現のマッチングがどのように機能するかについて何かが欠けていると思います。何か案は？:)

score 4 · Accepted Answer

によって与えられる値は、2 番目のグループによってキャプチャされたmatch.Groups[2].Value最後の値です。

すべての値を見つけるmatch.Groups[2].Captures[i].Valueには、この場合はからまでiの範囲を調べます。（第1グループも同様です。）02match.Groups[1].Value

（質問の+1、今日何かを学びました！）

score 3 · Accepted Answer

これを試して：

string text = "   apple , banana ,orange,peanut";

var matches = Regex.Matches(text, @"\s*(?<word>\w+)\s*,?")
        .Cast<Match>()
        .Select(x => x.Groups["word"].Value)
        .ToList();

score 2 · Accepted Answer

キャプチャグループを繰り返しています。一致が繰り返されるたびに、前のコンテンツが上書きされます。したがって、2 番目のキャプチャグループの最後の一致のみが最後に利用可能になります。

2 番目のキャプチャグループを次のように変更できます。

^\s*([a-z_]\w*)((?:\s*,\s*(?:[a-z_]\w*))*)\s*$

結果は、2 番目のグループの「、バナナ、オレンジ、ピーナッツ」になります。あなたがこれを望むかどうか、私にはわかりません。

文字列にそのパターンがあることを確認し、各単語を抽出する場合。私はそれを2つのステップで行います。

正規表現でパターンを確認してください。
パターンが正しい場合は、先頭と末尾の空白を削除し、で分割し\s*,\s*ます。

score 2 · Accepted Answer

簡単な正規表現:

(?:^| *)(.+?)(?:,|$)

説明：

?:    # Non capturing group
^| *  # Match start of line or multiple spaces
.+    # Capture the word in the list, lazy
?:    # Non capture group
,|$   # Match comma or end of line

注: Rublularは、このようなことをテストするのに適した Web サイトです。

c# - 奇妙な正規表現の動作 - 最初と最後のキャプチャ グループのみに一致します

4 に答える 4

Related

Reference

c# - 奇妙な正規表現の動作 - 最初と最後のキャプチャグループのみに一致します