プロセスがリング順序で互いにメッセージを送受信する単純な MPICH プログラムがあります。
2 つの同一の仮想マシンをセットアップし、ネットワークが正常に機能していることを確認しました。単純な MPICH プログラムを両方のマシンでテストしましたが、問題なく動作します。上記のプログラムのように、異なるマシン上のプロセス間で通信しようとすると、問題が発生します。次のエラーが表示されます。
MPI_Send の致命的なエラー: プロセスが失敗しました。エラー スタック:
MPI_Send(171)................: MPI_Send(buf=0xbfed8c08, count=1, MPI_INT, dest=1,
tag =1, MPI_COMM_WORLD) に失敗しました
MPID_nem_tcp_connpoll(1826): ランク 1 の通信エラー: 接続が拒否されました
- SSH はパスワードレスで、両側で正常に動作します。
/etc/hosts
正しく構成されています。- 両方のマシンでファイアウォールが無効になっています。
- NFS クライアント/サーバーを構成し、それらの間でディレクトリを共有しました。(これによると)
- HydraでMPICHとOpenMPIの両方を試しました