非常に大きなzipファイルがあり、分割アーカイブとして複数の部分に分割されており、アーカイブ内に1つのファイルがあります。これらのアーカイブを結合したり抽出したりするのに十分なリソースがありません(生のテキストファイルはほぼ1TBです)。
理想的には次のようなものを使用して、テキストファイルを1行ずつ解析したいと思います。
import zipfile
for zipfilename in filenames:
with zipfile.ZipFile(zipfilename) as z:
with z.open(...) as f:
for line in f:
print line
これは可能ですか?もしそうなら、どうすればテキストファイルを読むことができますか?
- あまり多くのメモリを使用せずに(ファイル全体をメモリにロードすることは明らかに問題外です)
- zipファイルを抽出せずに
- (理想的には)zipファイルを結合せずに
よろしくお願いします。