32 ノード クラスタで NAS-UPC ベンチマークを実行しようとしています。
問題のサイズが小さい場合は問題なく動作します。より大きな問題サイズ (クラス D) に卒業すると、このエラーが発生します (MG ベンチマークの場合)
*** Caught a fatal signal: SIGBUS(7) on node 2/32
p4_error: latest msg from perror: Bad file descriptor
*** Caught a signal: SIGPIPE(13) on node 0/32
p4_error: latest msg from perror: Bad file descriptor
p4_error: latest msg from perror: Bad file descriptor
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** Caught a signal: SIGPIPE(13) on node 27/32
*** Caught a signal: SIGPIPE(13) on node 20/32
*** Caught a signal: SIGPIPE(13) on node 21/32
p4_error: latest msg from perror: Bad file descriptor
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
*** Caught a signal: SIGPIPE(13) on node 16/32
*** FATAL ERROR: recursion failure in AMMPI_SPMDExit
なぜこれが起こっているのか、誰でも説明できますか?また、このエラーを以前に見て修正したことがある人はいますか?
編集: メモリ関連の問題であることがわかりました。しかし、コンパイル時にアプリケーションに適切な量のメモリを割り当てることができません