python-2.7 - 大きなテキストファイルの読み取りの進行状況を取得する

Question

非常に大きなテキストファイル (サイズが数 GB) があり、これを Python に読み込んでから行ごとに処理する必要があります。

1 つのアプローチは、単純data=f.readlines()にコンテンツを呼び出してから処理することです。このアプローチにより、行の総数がわかり、処理の進行状況を簡単に測定できます。ただし、ファイルサイズを考えると、これはおそらく理想的なアプローチではありません。

代替の（そして私がより良いと思う）オプションは、次のように言うことです：

    for line in f:
      do something

ただ今、自分の進歩を測定する方法がわかりません。大きなオーバーヘッドを追加しない良いオプションはありますか? (進行状況を知りたい理由の 1 つは、ファイル内のすべての行のサイズが似ているため、残り時間の大まかな指標を把握し、スクリプトがまだ何かを実行しているか、どこかで動かなくなっているかを確認することです。 )

score 0 · Accepted Answer

Linux OS を使用している場合、解決策があるようです。

a = os.popen("wc -l some.txt")
f = a.read()

読み取り時に、行数とファイル名を取得します

python-2.7 - 大きなテキスト ファイルの読み取りの進行状況を取得する

1 に答える 1

Related

Reference

python-2.7 - 大きなテキストファイルの読み取りの進行状況を取得する