私は巨大な CSV ファイル (20 ~ 25Mln 行) を操作していますが、多くの理由でそれらを小さな断片に分割したくありません。
私のスクリプトは、 csvモジュールを使用して行ごとにファイルを読み取ります。次の反復で読み取られる行 (または読み取られた行) の位置 (バイト番号) が必要です。
私は試した
>>> import csv
>>> f = open("uscompany.csv","rU")
>>> reader = csv.reader(f)
>>> reader.next()
....
>>> f.tell()
8230
しかし、csvモジュールはファイルをブロックごとに読み取るようです。反復を続けると同じ位置になるので
>>> reader.next()
....
>>> f.tell()
8230
助言がありますか?ご意見をお聞かせください。