Django アプリの一部として大規模な (600,000 レコード以上) データベースがあります。このアプリは、さまざまなオープン データ Web サービスから収集された情報を保存します。ときどき (1 週間に 1 回かそれ以下)、これらの Web サービスをチェックして、データが更新されていないか確認する必要があります。
これを行うための python スクリプトを作成しました。動作しますが、非常に遅く、完了する前にこのエラーが発生することがよくあります: ConnectionError: [Errno 104] Connection reset by peer
いくつかの実験に基づいて、このプロセスが完了するまでに数日かかると思います。スクリプトを最適化する以外に、この種の長時間実行される python プロセスを処理する最良の方法は何ですか?