Python の dmtcp の統合を使用して、並列実行で子プロセスをチェックポイントすることは可能ですか?
私の状況は次のとおりです。複数のワーカーが (apply_async を使用して) 非同期ジョブを受け取るmultiprocessing.Poolがあります。特定の大きなジョブは、すべてのリソース (CPU コアとメモリ) を必要とします。これらのジョブの 1 つが受け入れられたら、保留中のすべてのプロセスをチェックポイントし、実行を追い出し、大きなジョブを起動し、最後にチェックポイントされたプロセスを再開したいと考えています。