ヘッダーのないbz2
フォーマット済みファイル (それぞれ)が多数あります。次のようにして、各サイズ30GB
に簡単に分割できます。500M
pileline
bzcat logging.abc_gps.bz2 | pv | split -b 500M -d -a 4 --filter='bzip > $FILE.csv.bz2' - splitted_file-
['a' 'b' 'c' 'd' 'e' 'f' 'timestamp']
しかし、分割された各ファイルに含めたいヘッダーを追加することはできませんbz2
。
さらに重要なことは、 に基づいてファイルを分割するのではなく、データ内のの内容に基づいて1 日ごとにファイル500M
を分割したいbz2
(例:splitted_file_2021-01-01.csv.bz2
と)。splitted_file_2021-01-02.csv.bz2
timestamp
以下のように、データはタブ区切りのテキストです (ヘッダーはありません。追加する必要があります)。
19252547212 1 3041 2 1 74.18 1.8504 2021-05-01 00:00:00
19252547213 1 5055 2 1 0 0 2021-05-01 00:00:00
19252547214 1 5073 1 1 53.81 0.1836 2021-05-01 00:00:00