0

lucene クエリを解析するための文法を実装しようとしています。これまでのところ、範囲クエリのサポートを追加しようとするまで、すべてがスムーズに進みました。私の文法はさておき、Luceneの詳細は次のようになります。

grammar ModifiedParser;

TERM_RANGE : '[' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) ']'
           | '{' ('*' | TERM_TEXT) 'TO' ('*' | TERM_TEXT) '}'
           ;

query : not (booleanOperator? not)* ;

booleanOperator : andClause
                | orClause
                ;

andClause : 'AND' ;
notClause : 'NOT' ;
orClause  : 'OR' ;

not : notClause? MODIFIER? clause;

clause : unqualified                        
       | qualified                          
       ;

unqualified : TERM_RANGE                   # termRange
            | TERM_PHRASE                  # termPhrase
            | TERM_PHRASE_ANYTHING         # termTruncatedPhrase
            | '(' query ')'                # queryUnqualified
            | TERM_TEXT_TRUNCATED          # termTruncatedText
            | TERM_NORMAL                  # termText
            ;

qualified : TERM_NORMAL ':' unqualified                  
          ;

fragment TERM_CHAR  : (~(' ' | '\t' | '\n' | '\r' | '\u3000'
                    | '\'' | '\"' | '(' | ')' | '[' | ']' | '{' | '}'
                    | '+' | '-' | '!' | ':' | '~' | '^'
                    | '?' | '*' | '\\' ))
                    ;

fragment TERM_START_CHAR : TERM_CHAR
                         | ESCAPE
                         ;

fragment ESCAPE : '\\' ~[];

MODIFIER : '-'
         | '+'
         ;

AND : 'AND';
OR : 'OR';
NOT : 'NOT';

TERM_PHRASE_ANYTHING : '"'  (ESCAPE|~('\"'|'\\'))+  '"' ;
TERM_PHRASE          : '"' (ESCAPE|~('\"'|'\\'|'?'|'*'))+ '"' ;
TERM_TEXT_TRUNCATED : ('*'|'?')(TERM_CHAR+ ('*'|'?'))+ TERM_CHAR*
                    | TERM_START_CHAR (TERM_CHAR* ('?'|'*'))+ TERM_CHAR+
                    | ('?'|'*') TERM_CHAR+
                    ;  

TERM_NORMAL : TERM_TEXT;                                            

fragment TERM_TEXT : TERM_START_CHAR TERM_CHAR* ;

WS : [ \t\r\n] -> skip ;

ビジターを実行してトークンを操作しようとすると、 、、およびasd [ 10 TO 100 ] { 1 TO 1000 } 100..1000のトークン認識エラーが発生し、3 番目の範囲のルールにアクセスしようとするだけです。ここで何が欠けているか知っていますか?前もって感謝します[]}{termRange

4

1 に答える 1

1

レクサー ルールを作成TERM_RANGEしたので、文字レベルですべてを説明する必要があります。特に、入力に空白文字を許可するのを忘れていました。

termRange代わりにパーサー ルールを作成した方が、はるかに有利な立場に立つことができます。

于 2013-09-05T17:03:03.073 に答える