Python を使用してトレース ファイルを処理することに関して 1 つの問題があります (10 億行のデータが含まれています)。
私がやりたいことは、プログラムがファイル内の特定の行 (行番号 x など) を見つけ、ファイル内のこの行 (行番号 x) から別のシンボルを見つける必要があるということです。行が見つかったら、もう一度 (行番号 x) から別の行を検索します。
私が今やったことは次のとおりですが、問題は常にファイルを再度開き、最初から読み取って一致するものを見つける必要があることです(行#> x、および必要な記号が含まれています)。1 つの大きなトレース ファイルの場合、処理に時間がかかりすぎます。
1.
for line in file.readlines()
i++ #update the line number
if i > x:
if (line.find()):
また:
for i, line in enumerate(open(file)):
if i > x:
if ....
より良いアイデアのヒントを教えてくれる人はいますか?
ありがとう