HDF5 ライブラリを使用して並列 I/O を行う MPI プログラムがあります。デバッグ中に奇妙な問題が発生しました。簡単なテスト ケースで valgrind を使用してメモリ リークをテストしましたが、エラーは報告されません。次に、120、240、360、および 480 コアを使用して別のテスト ケースを試します。このエラーが発生する 120 コアのケースを除いて、すべてのケースが実行されます。
MPI: MPI_COMM_WORLD rank 108 has terminated without calling MPI_Finalize()
MPI: aborting job
MPI: Received signal 9
私はこれに困惑しています。エラーの意味は何ですか? メモリ不足が原因でしょうか?