Flex&Bison で式検証ツールを実装したいと考えています。私のツールでは、';' で終わる式を受け入れます。式の中に何か問題があるかどうかを確認します。エラーが発生したときに、エラー トークンの適切な位置を取得したい。問題は、複数のエラーが発生した場合、常に間違った位置になることです。
パーサー:
%{
# include <stdio.h>
# include <stdlib.h>
# include "roofexp.h"
# include "symbol.h"
%}
%locations
%union {
struct ast *a;
double d;
struct symbol *s; /* which symbol */
struct symlist *sl;
int fn; /* which function */
char *str;
}
/* edeclare tokens */
%token <d> NUMBER
%token <str> STRING
%token <s> NAME
%token <fn> FUNC
%token EOL
%token IF THEN ELSE WHILE DO LET
%nonassoc <fn> CMP
%right '='
%left '+' '-'
%left '*' '/'
%nonassoc '|' UMINUS
%type <a> exp stmt list explist
%start calclist
%%
calclist: /* nothing */
| calclist stmt ';' {
if(debug)
dumpast($2, 0);
printf("= %4.4g\n> ", eval($2));
treefree($2);
free_string_table();
FreeSymbolTable();
}
| calclist error EOL { YYERROR; }
;
stmt: IF exp THEN list { $$ = newflow('I', $2, $4, NULL); }
| IF exp THEN list ELSE list { $$ = newflow('I', $2, $4, $6); }
| exp
;
list: /* nothing */ { $$ = NULL; }
| stmt ';' list { if ($3 == NULL)
$$ = $1;
else
$$ = newast('L', $1, $3);
}
;
exp: exp CMP exp { $$ = newcmp($2, $1, $3); }
| exp '+' exp { $$ = newast('+', $1,$3); }
| exp '-' exp { $$ = newast('-', $1,$3);}
| exp '*' exp { $$ = newast('*', $1,$3); }
| exp '/' exp {
$$ = newast('/', $1, $3);
}
| '|' exp { $$ = newast('|', $2, NULL); }
| '(' exp ')' { $$ = $2; }
| '-' exp %prec UMINUS { $$ = newast('M', $2, NULL); }
| NUMBER { $$ = newnum($1); }
| STRING { $$ = newstr($1); add_string($1); }
| FUNC '(' explist ')' { $$ = newfunc($1, $3); }
| NAME { $$ = newref($1); }
| NAME '=' exp { $$ = newasgn($1, $3); }
| NAME '(' explist ')' { $$ = newcall($1, $3); }
;
explist: exp
| exp ',' explist { $$ = newast('L', $1, $3); }
;
レクサー:
%%
%{
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
# include "roofexp.h"
# include "roofexp.tab.h"
# include "symbol.h"
/* handle locations */
int yycolumn = 1;
#define YY_USER_ACTION \
yylloc.first_line = yylloc.last_line = yylineno; \
yylloc.first_column = yycolumn; \
yylloc.last_column = yycolumn + yyleng - 1; \
yycolumn += yyleng;
%}
%option yylineno noyywrap
/* float exponent */
EXP ([Ee][-+]?[0-9]+)
%%
/* single character ops */
"#" |
"+" |
"-" |
"*" |
"/" |
"=" |
"|" |
"," |
";" |
"(" |
")" { return yytext[0]; }
/* comparison ops */
">" { yylval.fn = 1; return CMP; }
"<" { yylval.fn = 2; return CMP; }
"<>" { yylval.fn = 3; return CMP; }
"==" { yylval.fn = 4; return CMP; }
">=" { yylval.fn = 5; return CMP; }
"<=" { yylval.fn = 6; return CMP; }
/* keywords */
"if" { return IF; }
"then" { return THEN; }
"else" { return ELSE; }
"while" { return WHILE; }
"do" { return DO; }
"let" { return LET;}
/* built in functions */
"sin" { yylval.fn = FUNC_sin; return FUNC; }
"cos" { yylval.fn = FUNC_cos; return FUNC; }
"pow" { yylval.fn = FUNC_pow; return FUNC; }
"GetDz" { yylval.fn = FUNC_GetDz; return FUNC;}
/* debug hack */
"debug"[0-9]+ { debug = atoi(&yytext[5]); printf("debug set to %d\n", debug); }
/* names */
[_a-zA-Z][_a-zA-Z0-9]* {
if(LookupSymbolTable(yytext, 0, VARIABLE) == NULL)
yyerror("未定义的变量: %s", yytext);
else
yylval.s = lookup(yytext); return NAME;
}
[0-9]+"."[0-9]*{EXP}? |
"."?[0-9]+{EXP}? { yylval.d = atof(yytext); return NUMBER; }
\"[^\"\n]*\" { printf("string=%s\n", yytext); }
\"[^\"\n]*$ { yyerror("unterminated string literal: %s\n", yytext); }
"//".*
[ \t]
\n { yycolumn = 1; }
. { yyerror("Mystery character %c\n", *yytext); }
%%
表現:
pow(2)+
pow(2, 4)
;
エコー:
3-1: error: at ';': too few arguments for call
しかし、正しい位置は 1 対 1 であるべきです。レクサーとパーサーの何が問題なのですか。また、適切な位置を取得したい場合は、どのようにすればよいですか?