問題タブ [boost-tokenizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - boost::tokenizer はセパレータ間にトークンがないことを考慮します
「;」を取得するためにboost::tokenizerを使用しています からフィールドを分離しましたstring
。以下のコードに示すようにフィールドを取得できますが、2 つの質問があります。
- 提供されたセパレーターに基づいて文字列内のトークンの数を知るためにトークナイザーが提供する関数はありますか?
- テスト文字列に 3 つのフィールドがあるとします
a;b;c
。次のコードは、それらすべてを出力します。しかし、空のフィールドも印刷する必要があります。たとえば、文字列a;;;b;c
の場合、トークンには2 番目と 3 番目の要素として何も含まれていない必要があります。つまり、2 番目と 3 番目のトークンは空にする必要があります。
c++ - トークナイザーのブースト: 余分なスペース?
Boost Tokenizer を使用して、(x,y) などのフォーマットされた座標を削除しています。ただし、削除後にスペースを追加しています。スペースはありませんが、これを取り除く方法がわかりません。
ベクトルでは、結果は次のようになります。
[x][y][スペース]
c++ - C++ で (実際の、適切な、フル機能の) CSV を読み取って解析するにはどうすればよいですか?
もう読んだ:
C++ で CSV ファイルを読み取って解析するにはどうすればよいですか?
しかし、そこにあるタイトルはかなり誤解を招くものです。CSV 自体の読み取りについて質問するのではなく、複数行のコンマ区切りの非エスケープ データ ファイルのみです。
ここで、実際のCSVを解析したいと思います- 適切な形式 ( RFC 4180準拠) - 引用符で囲まれたフィールドと、引用符で囲まれたフィールド内の改行、コンマ、および二重引用符。少なくとも、LF ではなく CRLF をレコード区切り文字として期待するオプションがあります。
より具体的には、引用(およびその他の問題)を適切に処理するために、より単純なバージョンの質問からブーストトークナイザーベースの提案を拡張できますか?