Pandas は優れた.read_table()
機能を備えていますが、巨大なファイルは MemoryError になります。
特定の条件を満たす行のみをロードする必要があるため、それらのみをロードする方法を探しています。
これは、一時ファイルを使用して実行できます。
with open(hugeTdaFile) as huge:
with open(hugeTdaFile + ".partial.tmp", "w") as tmp:
tmp.write(huge.readline()) # the header line
for line in huge:
if SomeCondition(line):
tmp.write(line)
t = pandas.read_table(tmp.name)
このような一時ファイルの使用を避ける方法はありますか?