ruby - 2 つの明確なエンドポイント間のパターンの複数の出現を取得する方法

Question

次のような文字列があります。

CREATE TABLE foobar (
   bar foo,
   foo bar
) DISTRIBUTED BY

この文字列からすべての列定義を取得したいと思います。私は試した：

my_string.scan /CREATE TABLE .*\n([^\n]*?)\n.*DISTRIBUTED BY/

しかし、目的の値で返されません ( ["bar foo,", "foo bar"]) 。何か案は？

score 3 · Accepted Answer

スキャン方法の重要なポイントは、最後のマッチが終了したときに新しいマッチが始まることです。

a = "cruel world"
a.scan(/.../)        #=> ["cru", "el ", "wor"]

そのため、文字列の先頭と途中の両方で一致するようにパターンを定義する必要があります。言うまでもなく、このような後読み式を作成するのは簡単ではありません。

しかし、これはあなたの特定の目標には十分でしょうか?

s = <<HR
CREATE TABLE foobar (
   bar foo,
   foo bar
) DISTRIBUTED BY}
HR

ax = s.scan /\s+(.+?)(?:,\n|\n\))/
#=> [["bar foo"], ["foo bar"]]

CREATE TABLEご覧のとおり、ここでは、文字列にクエリの準備ができていると仮定して、一致を試みませんでした。

score 1 · Accepted Answer

これがあなたがしようとしていたことだと思います：

/CREATE TABLE .*\n((?:.*\n)+).*DISTRIBUTED BY/

(?:.*\n)個々の行に一致するため((?:.*\n)+)、グループ #1 の 1 つまたは複数の行をキャプチャします。最後の行末の改行 ( foo bar) が含まれていますが、コンマをクリーンアップすると同時に削除できます (例えばからbar foo,)。

もっと複雑なことを考えている場合は、実際のパーサーを使用することを考えてください。正規表現は SQL ではうまく機能しません。

score 0 · Accepted Answer

0

おそらく、これが進むべき道です。

my_string.split[1..-2].map(&:strip)

于 2012-09-17T16:05:41.160 に答える

3 に答える 3