1

ブースト循環バッファでブースト正規表現を使用していて、一致が発生する位置を「記憶」したいのですが、これを行うための最良の方法は何ですか?以下のコードを試しましたが、「end」は常に同じ値を格納しているようです。たとえば、前の「終了」から最新の「終了」までトラバースしようとすると、機能しません。

  boost::circular_buffer<char> cb(2048);
  typedef boost::circular_buffer<char>::iterator  ccb_iterator;
  boost::circular_buffer<ccb_iterator> cbi(4); 

  //just fill the whole cbi with cb.begin()  
  cbi.push_back(cb.begin());
  cbi.pushback(cb.begin());
  cbi.pushback(cb.begin());
  cbi.pushback(cb.begin());


 typedef regex_iterator<circular_buffer<char>::iterator> circular_regex_iterator;

 while (1)
{
  //insert new data in circular buffer (omitted)
  //basically reads data from file and pushes it back to cb

  boost::circular_buffer<char>::iterator    start,end;  

 circular_regex_iterator regexItr(
        cb.begin(), 
        cb.end() , 
         re, //expression of the regular expression
         boost::match_default | boost::match_partial); 
    circular_regex_iterator last;

    while(regexItr != last)
    {

            if((*regexItr)[0].matched == false)
           {
               //partial match      
               break;
            }
        else
        {
           // full match:
           start = (*regexItr)[0].first;
           end = (*regexItr)[0].second; 

             //I want to store these "end" positions to to use later so that I can 
             //traverse the buffer between these positions (matches).  

            //cbi stores positions of these matches, but this does not seem to work!                 
             cbi.push_back(end);    

            //for example, cbi[2] --> cbi[3] traversal works only first time this 
            //loop is run!
        }

        ++regexItr;
    }

}

4

1 に答える 1

0

これは、あなたがしていることを再構築する試みほど多くの答えではありません。文字列から初期化された単純な循環バッファを作成しており、そのバッファを介して正規表現の一致をトラバースし、一致した範囲を出力します。すべて正常に動作しているようです。

範囲自体を循環バッファに格納することはお勧めしません。または、少なくとも範囲はペアで保存する必要があります。

これが私のテストコードです:

#include <iostream>
#include <string>
#include <boost/circular_buffer.hpp>
#include <boost/regex.hpp>
#include "prettyprint.hpp"

typedef boost::circular_buffer<char> cb_char;
typedef boost::regex_iterator<cb_char::iterator> cb_char_regex_it;

int main()
{
  std::string sample = "Hello 12 Worlds 34 ! 56";
  cb_char cbc(8, sample.begin(), sample.end());

  std::cout << cbc << std::endl;    // (*)

  boost::regex expression("\\d+");  // just match numbers

  for (cb_char_regex_it m2, m1(cbc.begin(), cbc.end(), expression); m1 != m2; ++m1)
  {
    const auto & mr = *m1;
    std::cout << "--> " << mr << ", range ["
              << std::distance(cbc.begin(), mr[0].first) << ", "
              << std::distance(cbc.begin(), mr[0].second) << "]" << std::endl;
  }
}

(これは、きれいなプリンターを使用して生の循環バッファーを印刷します。マークされた行を削除できます(*)。)


更新:一致を保存するための可能な方法は次のとおりです。

typedef std::pair<std::size_t, std::size_t> match_range;
typedef std::vector<match_range>            match_ranges;

/* ... as before ... */

  match_ranges ranges;

  for (cb_char_regex_it m2, m1(cbc.begin(), cbc.end(), expression); m1 != m2; ++m1)
  {
    const auto & mr = *m1;

    ranges.push_back(match_range(std::distance(cbc.begin(), mr[0].first), std::distance(cbc.begin(), mr[0].second)));

    std::cout << "--> " << mr << ", range " << ranges.back() << std::endl;
  }

  std::cout << "All matching ranges: " << ranges << std::endl;
于 2011-08-15T12:41:35.890 に答える