さて、私はプロローグを使用して単純な xml パーサーを構築しています。そして、次のxmlファイルがあります。
<ip> <line> 7 </line> <envt> p1:1 in main:1 </envt> </ip>
<contour>
<name> main:1 </name>
<items>
<item> <var> x:int </var> <val> 2 </val> </item>
<item> <var> y:int </var> <val> 2 </val> </item>
</items>
<rpdl> system </rpdl>
<nested>
<contour>
<name> p1:1 </name>
<items>
<item> <var> y:int </var> <val> 0 </val> </item>
<item> <var> q:proc </var> <val> p2 in main:1 </val> </item>
</items>
<rpdl> <line> 21 </line> <envt> main:1 in root:1 </envt> </rpdl>
</contour>
</nested>
</contour>
</program_state>
Prolog では、次の DCG ルールを使用します。
xml([E]) --> element(E).
xml([E|L]) --> element(E), xml(L).
element(E) --> begintag(N), elements(L), endtag(N), {E =.. [N|L]}.
elements(L) --> xml(L).
elements([E]) --> [E].
begintag(N) --> ['<', N, '>'].
endtag(N) --> ['<', '/', N, '>'].
そのため、ルールは「p1:1 in main:1」、「x:int」、「main:1」などを処理できません。私は実際にそれらを「p1」、「x」、「main」に変更しようとしましたが、パーサーは完全に正常に動作します。パーサーが不規則なトークンを処理できるようにするには、どのようなルールを追加すればよいでしょうか?
解析ツリーは次のようになります。
program_state(
ip(line(7), envt(p1:1 in main:1)),
contour(name(main:1),
items(item(var(x:int),val(2)),
item(var(y:int),val(2))),
rpdl(system),
nested(contour( name(p1:1),
items(item(var(y:int),val(0)),
item(var(q:proc),val(p2 in main:1))),
rpdl(line(21),envt(main:1 in root:1)),
))))
以下は私が得るものです:
program_state(
ip(line(7), envt(p1)),
contour(name(main),
items(item(var(x), val(2)),
item(var(y), val(2))),
rpdl(system),
nested(contour(name(p1),
items(item(var(y), val(0)),
item(var(q), val(p2))),
rpdl(line(21), envt(main))
)))).