Python で非常に大きな csv (big = 数十ギガバイト) ファイルを解析していますが、すべての行の最初の列の値だけが必要です。私はこのコードを書き、それを行うためのより良い方法があるかどうか疑問に思いました:
delimiter = ','
f = open('big.csv','r')
for line in f:
pos = line.find(delimiter)
id = int(line[0:pos])
最初の区切り文字の前の文字列の部分を取得するより効果的な方法はありますか?
編集: CSV モジュールについては知っています (そして時々使用しました) が、このファイルのすべての行をメモリにロードする必要はありません - 最初の列が必要です。それでは、文字列の解析に焦点を当てましょう。