python - カスタマイズされた BNF パーサー用の Python モジュールはありますか?

Question

友達。

解析する必要がある「make」のようなスタイルファイルがあります。文法は次のようなものです。

samtools=/path/to/samtools
picard=/path/to/picard

task1: 
    des: description
    path: /path/to/task1
    para: [$global.samtools,
           $args.input,
           $path
          ]

task2: task1

Where$globalには、グローバルスコープで定義された変数が含まれます。$path「ローカル」変数です。$argsユーザーから渡されたキー/ペアの値が含まれています。

このファイルをいくつかの python ライブラリで解析したいと思います。解析ツリーを返す方がよいでしょう。間違いがある場合は、報告したほうがよいでしょう。私はこれを見つけました: CodeTalkerとyeanpypa。この場合、それらは使用できますか? 他の推奨事項はありますか？

score 6 · Accepted Answer

あなたの例に基づいて、メイクファイル構造が許可するものを推測する必要がありましたが、これで近づくはずです:

from pyparsing import *
# elements of the makefile are delimited by line, so we must
# define skippable whitespace to include just spaces and tabs
ParserElement.setDefaultWhitespaceChars(' \t')
NL = LineEnd().suppress()

EQ,COLON,LBRACK,RBRACK = map(Suppress, "=:[]")
identifier = Word(alphas+'_', alphanums)

symbol_assignment = Group(identifier("name") + EQ + empty + 
                          restOfLine("value"))("symbol_assignment")
symbol_ref = Word("$",alphanums+"_.")

def only_column_one(s,l,t):
    if col(l,s) != 1:
        raise ParseException(s,l,"not in column 1")
# task identifiers have to start in column 1
task_identifier = identifier.copy().setParseAction(only_column_one)

task_description = "des:" + empty + restOfLine("des")
task_path = "path:" + empty + restOfLine("path")
task_para_body = delimitedList(symbol_ref)
task_para = "para:" + LBRACK + task_para_body("para") + RBRACK
task_para.ignore(NL)
task_definition = Group(task_identifier("target") + COLON + 
        Optional(delimitedList(identifier))("deps") + NL +
        (
        Optional(task_description + NL) & 
        Optional(task_path + NL) & 
        Optional(task_para + NL)
        )
    )("task_definition")

makefile_parser = ZeroOrMore(
    symbol_assignment |
    task_definition |
    NL
    )


if __name__ == "__main__":
    test = """\
samtools=/path/to/samtools
picard=/path/to/picard

task1:  
    des: description 
    path: /path/to/task1 
    para: [$global.samtools, 
           $args.input, 
           $path 
          ] 

task2: task1 
"""

# dump out what we parsed, including results names
for element in makefile_parser.parseString(test):
    print element.getName()
    print element.dump()
    print

版画:

symbol_assignment
['samtools', '/path/to/samtools']
- name: samtools
- value: /path/to/samtools

symbol_assignment
['picard', '/path/to/picard']
- name: picard
- value: /path/to/picard

task_definition
['task1', 'des:', 'description ', 'path:', '/path/to/task1 ', 'para:', 
 '$global.samtools', '$args.input', '$path']
- des: description 
- para: ['$global.samtools', '$args.input', '$path']
- path: /path/to/task1 
- target: task1

task_definition
['task2', 'task1']
- deps: ['task1']
- target: task2

dump() の出力は、解析された要素内のフィールドを取得するために使用できる名前、または所有している要素の種類を区別するために使用できる名前を示しています。dump() は、pyparsing が解析したものを出力する便利な汎用ツールです。以下は、特定のパーサーに固有のコードで、フィールド名をドット付きオブジェクト参照 ( element.target、element.deps、element.nameなど) または辞書形式の参照 ( element[key])として使用する方法を示しています。

for element in makefile_parser.parseString(test):
    if element.getName() == 'task_definition':
        print "TASK:", element.target,
        if element.deps:
            print "DEPS:(" + ','.join(element.deps) + ")"
        else:
            print
        for key in ('des', 'path', 'para'):
            if key in element:
                print " ", key.upper()+":", element[key]

    elif element.getName() == 'symbol_assignment':
        print "SYM:", element.name, "->", element.value

プリント:

SYM: samtools -> /path/to/samtools
SYM: picard -> /path/to/picard
TASK: task1
  DES: description 
  PATH: /path/to/task1 
  PARA: ['$global.samtools', '$args.input', '$path']
TASK: task2 DEPS:(task1)

score 3 · Accepted Answer

私はpyparsing過去に使用したことがあり、非常に満足しています (qv、pyparsing プロジェクトサイト)。

python - カスタマイズされた BNF パーサー用の Python モジュールはありますか?

2 に答える 2

Related

Reference