私は#huge#テキストファイル(100mbから1gbまで)に取り組んでいます。それらを解析して特定のデータを抽出する必要があります。厄介なのは、ファイルに明確に定義されたセパレータがないことです。
例えば:
"element" 123124 16758 "12.4" "element" "element with white spaces inside" "element"
「(引用符)で制限された文字列の空白を削除する必要があります。問題は、引用符の「外側」の空白を消去してはならないことです(そうしないと、一部の数値がマージされます)。適切なsedソリューションが見つかりません。誰かがこれを手伝ってくれる?