大きな CSV ファイルをインポートし、ファイル内の各単語の出現回数をカウントし、カウントを別の CSV ファイルにエクスポートする Python スクリプトがあります。
しかし、何が起こっているかというと、そのカウント部分が終了し、エクスポートが開始されるとKilled
、ターミナルに表示されます。
これはメモリの問題ではないと思います(もしそうなら、メモリエラーではなくメモリエラーが発生すると思いますKilled
)。
プロセスに時間がかかりすぎている可能性がありますか? もしそうなら、これを回避できるようにタイムアウト期間を延長する方法はありますか?
コードは次のとおりです。
csv.field_size_limit(sys.maxsize)
counter={}
with open("/home/alex/Documents/version2/cooccur_list.csv",'rb') as file_name:
reader=csv.reader(file_name)
for row in reader:
if len(row)>1:
pair=row[0]+' '+row[1]
if pair in counter:
counter[pair]+=1
else:
counter[pair]=1
print 'finished counting'
writer = csv.writer(open('/home/alex/Documents/version2/dict.csv', 'wb'))
for key, value in counter.items():
writer.writerow([key, value])
が印刷された後にKilled
発生し、完全なメッセージは次のとおりです。finished counting
killed (program exited with code: 137)