約 500 GB のテキスト ファイルが数か月に分けられています。これらのテキスト ファイルでは、最初の 43 行は単なる接続情報です (不要)。次の 75 行は、観測の記述子です。これに 4 行 (不要) が続き、次の観測 (75 行) が続きます。
私が欲しいのは、次のように特徴付けられるこれらの 75 行 (記述子はすべての観測に対して同じ場所にあります) だけです。
ID: 5523
Date: 20052012
Mixed: <Null>
.
.
5523;20052012;;..
そして、観察ごとにcsv形式に変更したいと思います。そのため、テキストファイルははるかに小さくなります。記述子は同じなので、たとえば最初の位置が ID であることがわかります。
テキスト ファイルが完成したら、次のファイルを開いて追加します (または、新しいファイルを作成する方が速いでしょうか?)。
私がやったことは非常に非効率的です。ファイルを開いています。読み込んでいます。行ごとにこれらの観測を削除します。テストサンプルでかなりの時間がかかる場合、明らかに最良の方法ではありません.
どんな提案も素晴らしいでしょう。