PRCE Regex を使用して、さまざまな Apache ウェブログの各フィールドをキャプチャしたいと考えています。これらのログの構造は、次の例のようになります。
aaa bbb "cc c" ddd "eee" fff
各フィールドはスペースで区切られます。ただし、フィールドにスペースを含めることもできます。その場合は、フィールドの最初と最後に引用符を付けて結合します ("cc c")。スペースを含まないフィールドには、フィールドの最初と最後に引用符 ("eee") を付けることもできます。
結果には各フィールドのキャプチャ グループが含まれている必要があるため、例では次のようになります。 Group1: aaa Group2: bbb Group3: "cc c" Group4: ddd Group5: "eee" Group6: fff
私の問題は、たとえば量指定子を使用して、万能のソリューションが必要なことです-次のようなものです: (?:((aa|bb|"cc"|dd)\s){1,})
しかし、ここでは量指定子は常に aaa で繰り返されます。
きちんとした実用的なソリューションは大歓迎です。