2

私は現在、次の形式のテキストファイルでdbスキーマの解析に取り組んでいます:

(table_name) (table_description)

要素間の区切り文字はdoublereturn(\n\n)です。解析に使用して、これをマップに解析する必要がありboost::spiritます。

問題は、table_descriptionにdouble return(\n\n)を含めることもできることです。

table_nameの形式は厳密です。これは*qi::char_("a-z0-9_")です。には任意のtable_description文字を含めることができますが、常に大文字から始まります。

このパーサーの文法を作成する方法はありますか?

4

1 に答える 1

3

これは、Spirit docs: Spirit.Qiを使用したキーと値のペアのリストの解析(2009年11月15日)の記事によく似ています。

このために私が考えることができる最も簡単な文法は、括弧に依存しています。

    start         = pair % "\n\n";
    parenthesized = '(' > *(char_ - ')') > ')';
    pair          = parenthesized >> "\n\n" >> parenthesized;

もちろん、必要なテーブル名と説明(大文字で始まるなど)の正確な構文を要求するように拡張することもできますが、上記は説明のためのものです。

/nifty/ビットは次のとおりです。

  • char_ - ')'to _greedilyを括弧内のすべてに一致させるための使用(これは、ネストされた括弧のセットをまだサポートしていないことに注意してください)
  • std::pairに直接解析するためのstd::pairの融合アダプターの使用
  • 改行を無視しないようにするためのqi::blank(ではない)スキッパーの使用qi::space

完全なサンプルは次のとおりです。

//#define BOOST_SPIRIT_DEBUG
#include <boost/fusion/adapted/std_pair.hpp>
#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/karma.hpp>

namespace qi    = boost::spirit::qi;
namespace karma = boost::spirit::karma;

typedef std::map<std::string, std::string> map_t;

template <typename It, typename Skipper = qi::space_type>
    struct parser : qi::grammar<It, map_t(), Skipper>
{
    parser() : parser::base_type(start)
    {
        using namespace qi;
        // using phx::bind; using phx::ref; using phx::val;

        start         = pair % "\n\n";
        pair          = parenthesized >> "\n\n" >> parenthesized;
        parenthesized = '(' > *(char_ - ')') > ')';

        BOOST_SPIRIT_DEBUG_NODE(parenthesized);
        BOOST_SPIRIT_DEBUG_NODE(pair);
        BOOST_SPIRIT_DEBUG_NODE(start);
    }

  private:
    qi::rule<It, std::string(), Skipper > parenthesized;
    qi::rule<It, std::pair<std::string, std::string>(), Skipper> pair;
    qi::rule<It, std::map <std::string, std::string>(), Skipper> start;
};

template <typename C, typename Skipper>
    bool doParse(const C& input, const Skipper& skipper)
{
    auto f(std::begin(input)), l(std::end(input));

    parser<decltype(f), Skipper> p;
    map_t data;

    try
    {
        bool ok = qi::phrase_parse(f,l,p,skipper,data);
        if (ok)   
        {
            std::cout << "parse success\n";
            std::cout << "data: " << karma::format(
                 (karma::auto_ << ": \"" << karma::auto_ << "\"") % karma::eol, 
                 data) << "\n";
        }
        else      std::cerr << "parse failed: '" << std::string(f,l) << "'\n";

        if (f!=l) std::cerr << "trailing unparsed: '" << std::string(f,l) << "'\n";
        return ok;
    } catch(const qi::expectation_failure<decltype(f)>& e)
    {
        std::string frag(e.first, e.last);
        std::cerr << e.what() << "'" << frag << "'\n";
    }

    return false;
}

template <typename C>
    bool doParse(const C& input)
{
    return doParse(input, qi::blank);
}

int main()
{
    const std::string input = "(table_name)\n\n(table_description)\n\n(other_table)\n\n(other\n\ndescription)";
    bool ok = doParse(input);

    return ok? 0 : 255;
}

テスト出力:

parse success
data: other_table: "other

description"
table_name: "table_description"
于 2012-06-20T18:34:41.247 に答える