Marpa::R2::Scanless::G を使用して、従来のテキスト ファイル形式を解析しています。ファイル形式には、よく構造化されたセクションが一番上にあり、その後に、構造化されていないテキストと uuencode されたものが続きます。後者のものは完全に無視できますが、Marpa SLIF インターフェースに伝える方法がわかりません。残りのテキストは気にしないでください。
非常に簡単に言えば、ファイルは次のようになります。
("field_a_val" 1,
"field_b_vals" (1,2,3),
"field_c_pairs" ((a 1)(b 2)(c 3))
)now_stuff_i_dont_care_about a;oiwermnv;alwfja;sldfa
asdf343avadfg;okm;om;oia3
e{<|1ydblV, HYED c"L. 78b."8
U=nK Wpw: Qh(e x!,~dU...
必要なすべてのデータを上部セクションから解析しましたが、一致させようとしないと下部ジャンクにヒットすると、次のようになります。
潜在的にメガバイトのがらくたを丸呑みするという用語を作成する方法がわかりません。遭遇したテキストに関係なく、ファイルの最後まで進み続けてください。:discard または 'pause => after' を使用しようとしてもうまくいきませんが、おそらくそれらを誤用している可能性があります。
コンテキストについては、解析と字句解析についてしっかりと理解していません。それが機能するまで、私は文法を叩きました。