antlr - バックトラックを控えながら（...）{...}関数リテラルを追加する

Question

バックトラックなしで関数呼び出しと括弧で囲まれたグループ化の両方を行う方法にある答えを基に、LL（*）以外の意味で実装されている関数リテラルを追加したいと思います。

...

tokens {
 ...
 FN;
 ID_LIST;
}

stmt
 : expr SEMI // SEMI=';'
 ;

callable
 : ...
 | fn
 ;

fn
 : OPAREN opt_id_list CPAREN compound_stmt
   -> ^(FN opt_id_list compound_stmt)
 ;

compound_stmt
 : OBRACE stmt* CBRACE

opt_id_list
 : (ID (COMMA ID)*)? -> ^(ID_LIST ID*)
 ;

私がやりたいのは、引数リスト（()または(a)または(a, b, c)）の後に。が続く無名関数リテラルを許可することcompound_stmtです。(a, b, c){...}いいですね。しかし(x)(y){}、それほど多くはありません。（もちろん(x) * (y){}、パーサーに関しては、同じように「有効」です((y){})()[1].x。）

score 0 · Accepted Answer

パーサーには、少し先を見越す必要があります。それがなくても実行できると思いますが、それは間違いなく、維持するのが面倒な恐ろしいパーサールールと受け入れるパーサー(a, 2, 3){...}（id-listの代わりにexpression-listを持つ関数リテラル）になります。）、例えば。これにより、ASTが作成された後にかなりのセマンティックチェックを行うことになります。

これを解決する（IMO）最良の方法は、に関数リテラルルールをcallable追加し、その前に構文述語を追加することです。これにより、パーサーは、実際に一致する前に、そのような代替が実際に存在することを確認します。

callable
 : (fn_literal)=> fn_literal
 | OPAREN expr CPAREN -> expr
 | ID
 ;

デモ：

grammar T;

options {
  output=AST;
}

tokens {
 // literal tokens
 EQ     = '==' ;
 GT     = '>' ;
 LT     = '<' ;
 GTE    = '>=' ;
 LTE    = '<=' ;
 LAND   = '&&' ;
 LOR    = '||' ;
 PLUS   = '+' ;
 MINUS  = '-' ;
 TIMES  = '*' ;
 DIVIDE = '/' ;
 OPAREN = '(' ;
 CPAREN = ')' ;
 OBRACK = '[' ;
 CBRACK = ']' ;
 DOT    = '.' ;
 COMMA  = ',' ;
 OBRACE = '{' ;
 CBRACE = '}' ;
 SEMI   = ';' ;

 // imaginary tokens
 CALL;
 INDEX;
 LOOKUP;
 UNARY_MINUS;
 PARAMS;
 FN;
 ID_LIST;
 STATS;
}

prog
 : expr EOF -> expr
 ;

expr
 : boolExpr
 ;

boolExpr
 : relExpr ((LAND | LOR)^ relExpr)?
 ;

relExpr
 : (a=addExpr -> $a) ( (oa=relOp b=addExpr    -> ^($oa $a $b))
                         ( ob=relOp c=addExpr -> ^(LAND ^($oa $a $b) ^($ob $b $c))
                         )?
                     )?
 ;

addExpr
 : mulExpr ((PLUS | MINUS)^ mulExpr)*
 ;

mulExpr
 : unaryExpr ((TIMES | DIVIDE)^ unaryExpr)*
 ;

unaryExpr
 : MINUS atomExpr -> ^(UNARY_MINUS atomExpr)
 | atomExpr
 ;

atomExpr
 : INT
 | call
 ;

call
 : (callable -> callable) ( OPAREN params CPAREN -> ^(CALL $call params)
                          | OBRACK expr CBRACK   -> ^(INDEX $call expr)
                          | DOT ID               -> ^(INDEX $call ID)
                          )*
 ;

callable
 : (fn_literal)=> fn_literal
 | OPAREN expr CPAREN -> expr
 | ID
 ;

fn_literal
 : OPAREN id_list CPAREN compound_stmt -> ^(FN id_list compound_stmt)
 ;

id_list
 : (ID (COMMA ID)*)? -> ^(ID_LIST ID*)
 ;

params
 : (expr (COMMA expr)*)? -> ^(PARAMS expr*)
 ;

compound_stmt
 : OBRACE stmt* CBRACE -> ^(STATS stmt*)
 ;

stmt
 : expr SEMI
 ;

relOp
 : EQ | GT | LT | GTE | LTE
 ;

ID     : 'a'..'z'+ ;
INT    : '0'..'9'+ ;
SPACE  : (' ' | '\t') {skip();};

(x)(y){}上記の文法によって生成されたパーサーは、次の3つのコードスニペットを適切に解析している間、入力を拒否します。

1

(a, b, c){ a+b*c; }

ここに画像の説明を入力してください

2

(x) * (y){ x.y; }

ここに画像の説明を入力してください

3

((y){})()[1].x

ここに画像の説明を入力してください

antlr - バックトラックを控えながら（...）{...}関数リテラルを追加する

1 に答える 1

1

2

3

Related

Reference