Ruby 内のParsletライブラリを使用して、単純なインデントに依存する構文を解析しようとしています。
以下は、解析しようとしている構文の例です。
level0child0
level0child1
level1child0
level1child1
level2child0
level1child2
結果のツリーは次のようになります。
[
{
:identifier => "level0child0",
:children => []
},
{
:identifier => "level0child1",
:children => [
{
:identifier => "level1child0",
:children => []
},
{
:identifier => "level1child1",
:children => [
{
:identifier => "level2child0",
:children => []
}
]
},
{
:identifier => "level1child2",
:children => []
},
]
}
]
現在使用しているパーサーは、ネスト レベル 0 および 1 のノードを解析できますが、それ以降は解析できません。
require 'parslet'
class IndentationSensitiveParser < Parslet::Parser
rule(:indent) { str(' ') }
rule(:newline) { str("\n") }
rule(:identifier) { match['A-Za-z0-9'].repeat.as(:identifier) }
rule(:node) { identifier >> newline >> (indent >> identifier >> newline.maybe).repeat.as(:children) }
rule(:document) { node.repeat }
root :document
end
require 'ap'
require 'pp'
begin
input = DATA.read
puts '', '----- input ----------------------------------------------------------------------', ''
ap input
tree = IndentationSensitiveParser.new.parse(input)
puts '', '----- tree -----------------------------------------------------------------------', ''
ap tree
rescue IndentationSensitiveParser::ParseFailed => failure
puts '', '----- error ----------------------------------------------------------------------', ''
puts failure.cause.ascii_tree
end
__END__
user
name
age
recipe
name
foo
bar
3 つのインデント ノードがネスト レベル 3 の識別子と一致することを期待する動的カウンターが必要であることは明らかです。
このようにParsletを使用して、インデントに敏感な構文パーサーを実装するにはどうすればよいですか? 出来ますか?