mpiexec
(mpich2)を使用していくつかのジョブを実行しています。
mpiexec
プロセスはゼロ以外のステータスで終了し、いくつかのワーカー プロセスが残ります
実行中の子ジョブのリストを印刷できます。
$ps aux | grep mpi
実行中/停止中のジョブを一覧表示する別の方法はありますか?
MPI がゾンビ プロセスを残した場合 (これは奇妙です。これは実際には起こってはならないことです)、最初に実行した実行可能ファイルが呼び出された名前が付けられます。したがって、次のようにプログラムを開始したとします。
mpiexec -n 4 ./a.out
次に、検索する必要があります
ps aux | grep a.out
これにより、まだぶらぶらしているすべてのプロセスのリストが表示されます。あなたが提案したことが通常うまくいかない理由は、mpirun
またはmpiexec
プロセスが(クラッシュまたは完了により)なくなった場合、明らかにそれを探し続けることができないためです。ただし、何らかの理由で子供たちがまだ周りにいる可能性があります。
これはあなたを助けるかもしれません: ps aux | grep MPICH