2

私はSpirit Qiに比較的慣れておらず、アセンブラーのような言語を解析しようとしています.

たとえば、次を解析したいと思います。

Func Ident{
    Mov name, "hello"
    Push 5
    Exit
}

ここまでは順調ですね。ちゃんと分解できます。ただし、エラー ハンドラーによって奇妙なエラーの場所が表示されることがあります。たとえば、次の欠陥のあるコードを見てください。

Func Ident{
    Mov name "hello" ; <-- comma is missing here
    Push 5
    Exit
}

この解析に関連するルールは次のとおりです。

    gr_function = lexeme["Func" >> !(alnum | '_')] // Ensure whole words
                    > gr_identifier
                    > "{"
                    > *( gr_instruction
                            |gr_label
                        |gr_vardecl
                        |gr_paramdecl)
                    > "}";

    gr_instruction = gr_instruction_names
                     > gr_operands;

    gr_operands = -(gr_operand % ',');

パースはエラーに気づきますが、Mov の後に "}" がないことを訴えます。問題は「Func」の定義にあるような気がしますが、特定できません。 パーサーに「,」の欠落について文句を言っ てもらいたいのですが、結果的なエラーについて文句を言っても問題ありませんが、カンマの欠落を原因として間違いなく特定する必要があります。

次のようなバリエーションを試しました。

gr_operands = -(gr_operand 
                >> *(','
                     > gr_operand)
                );

その他、その他の奇妙なエラーがあります。

「わかりました、オペランドのない命令があるかもしれませんが、オペランドを見つけて、次の前にコンマがない場合は、コンマで失敗します」と言う方法を知っている人はいますか?

アップデート

これまでのご回答ありがとうございます。gr_operand は次のように定義されます。

    gr_operand = ( gr_operand_intlit
                  |gr_operand_flplit
                  |gr_operand_strlit
                  |gr_operand_register
                  |gr_operand_identifier);

    gr_operand_intlit = int_;

    gr_operand_flplit = double_;

    gr_operand_strlit = '"'
                        > strlitcont
                        > '"'
                    ;

    gr_operand_register = gr_register_names;

    // TODO: Must also not accept the keywords from the statement grammar
    gr_operand_identifier = !(gr_instruction_names | gr_register_names)
                            >> raw[
                                    lexeme[(alpha | '_') >> *(alnum | '_')]
                                  ];

    escchar.name("\\\"");
    escchar     = '\\' >> char_("\"");

    strlitcont.name("String literal content");
    strlitcont  = *( escchar | ~char_('"') );
4

1 に答える 1

2

オペランドになり得るものを明示する必要があります。私はこれを推測しました:

gr_operand    = gr_identifier | gr_string;
gr_string     = lexeme [ '"' >> *("\"\"" | ~char_("\"")) >> '"' ];

無関係ですが、改行が新しいステートメントを開始することを明確にしたい場合があります (スキッパーとして blank_type を使用):

        >> "{"
        >> -(
                  gr_instruction
                | gr_label
                | gr_vardecl
                | gr_paramdecl
            ) % eol
        > "}";

これで、パーサーは、解析が失敗したときに改行が必要であると不平を言うことができます。

元の投稿のスケッチを使用して、完全に機能するサンプルを作成しました。

Coliruでライブをご覧ください:

#define BOOST_SPIRIT_DEBUG
#include <boost/spirit/include/qi.hpp>

namespace qi    = boost::spirit::qi;

template <typename It, typename Skipper = qi::blank_type>
    struct parser : qi::grammar<It, Skipper>
{
    parser() : parser::base_type(start)
    {
        using namespace qi;

        start = lexeme["Func" >> !(alnum | '_')] > function;
        function = gr_identifier
                    >> "{"
                    >> -(
                              gr_instruction
                            //| gr_label
                            //| gr_vardecl
                            //| gr_paramdecl
                        ) % eol
                    > "}";

        gr_instruction_names.add("Mov", unused);
        gr_instruction_names.add("Push", unused);
        gr_instruction_names.add("Exit", unused);

        gr_instruction = lexeme [ gr_instruction_names >> !(alnum|"_") ] > gr_operands;
        gr_operands = -(gr_operand % ',');

        gr_identifier = lexeme [ alpha >> *(alnum | '_') ];
        gr_operand    = gr_identifier | gr_string;
        gr_string     = lexeme [ '"' >> *("\"\"" | ~char_("\"")) >> '"' ];

        BOOST_SPIRIT_DEBUG_NODES((start)(function)(gr_instruction)(gr_operands)(gr_identifier)(gr_operand)(gr_string));
    }

  private:
    qi::symbols<char, qi::unused_type> gr_instruction_names;
    qi::rule<It, Skipper> start, function, gr_instruction, gr_operands, gr_identifier, gr_operand, gr_string;
};

int main()
{
    typedef boost::spirit::istream_iterator It;
    std::cin.unsetf(std::ios::skipws);
    It f(std::cin), l;

    parser<It, qi::blank_type> p;

    try
    {
        bool ok = qi::phrase_parse(f,l,p,qi::blank);
        if (ok)   std::cout << "parse success\n";
        else      std::cerr << "parse failed: '" << std::string(f,l) << "'\n";

        if (f!=l) std::cerr << "trailing unparsed: '" << std::string(f,l) << "'\n";
        return ok;
    } catch(const qi::expectation_failure<It>& e)
    {
        std::string frag(e.first, e.last);
        std::cerr << e.what() << "'" << frag << "'\n";
    }

    return false;
}
于 2013-08-23T13:09:55.000 に答える