Pythonを使用してjsonファイルにデータを追加する最適な方法を見つけようとしています。基本的に何が起こるかというと、約 100 のスレッドが開いてデータを配列に格納しているということです。完了したら、json.dump を使用してそれを json ファイルに送信します。ただし、これにはアレイが構築されるまでに数時間かかる場合があるため、最終的に RAM が不足してしまいます。そのため、このプロセスで使用する RAM の量を最小限に抑える最善の方法は何かを調べようとしています。以下は、RAMを大量に消費する私が持っているものです。
i = 0
twitter_data = {}
for null in range(0,1):
while True:
try:
for friends in Cursor(api.followers_ids,screen_name=self.ip).items():
twitter_data[i] = {}
twitter_data[i]['fu'] = self.ip
twitter_data[i]['su'] = friends
i = i + 1
except tweepy.TweepError, e:
print "ERROR on " + str(self.ip) + " Reason: ", e
with open('C:/Twitter/errors.txt', mode='a') as a_file:
new_ii = "ERROR on " + str(self.ip) + " Reason: " + str(e) + "\n"
a_file.write(new_ii)
break
## Save data
with open('C:/Twitter/user_' + str(self.id) + '.json', mode='w') as f:
json.dump(twitter_data, f, indent=2, encoding='utf-8')
ありがとう