経過時間 (壁時間) がユーザー + カーネル時間よりも短い状況について多くのスレッドが質問しているのを目にし、マルチスレッドがこの状況をどのように引き起こすかを理解しています。ただし、次の方法で MPI コードの実行のタイミングを計る場合:
$ time mpirun -n 4 ./a.out
経過時間は 4 ~ 5 分、ユーザー時間は約 40 秒、カーネル時間は約 40 秒です。プロセス間のバリア同期が原因の一部であるか、単一の MPI プロセスに関する情報を取得するのに時間がかかる可能性があると考えていますが、測定値の原因を正確に合理化することはまだできません。誰もそれを説明できますか?
どうもありがとう。