1

mpirunOS Xでシングルマシンモードで使用するのに問題があります。を使用してプログラムを実行mpirun -np 5 my_programすると、次のエラー出力が表示されます。

[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/pls/base/pls_base_orted_cmds.c at line 275
[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/pls/rsh/pls_rsh_module.c at line 1158
[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/errmgr/hnp/errmgr_hnp.c at line 90
mpirun noticed that job rank 1 with PID 85940 on node ...-MacBook-Pro.local exited on signal 6 (Abort trap). 
2 additional processes aborted (not shown)

どうやら、デフォルトではマシンへの接続にmpirun使用されます。rsh代わりに使用してみsshましたが、役に立ちませんでした。

mpirun --mca pls_rsh_agent ssh -np 5 my_program

次に、共有メモリ(sm)BTLを使用してみましたが、どちらも役に立ちませんでした。

mpirun --mca btl self,sm -np 5 my_program

最後に、マシンファイルを使用して、使用するだけであることを指定しようとしましたがlocalhost、どちらも役に立ちませんでした。

mpirun -np 5 -machinefile machinefile.local my_program

ここでは、(単一の)最初の行にmachinefile.localのみ含まれています。localhost

上記のすべての場合で、上記のタイムアウトエラーが発生します。

また、Mac OS Xファイアウォールが実行されておらず、マシンにSSH接続できることを確認しました。

4

2 に答える 2

0

fink の OpenMPI のバージョンを使用しているようですね。/usr/bin と /usr/lib に元の 1.2.x MPI がまだありますか? 奇妙な起動の問題を探す最初の場所は、競合する MPI ライブラリのバージョンです。

最初に のような単純なことを試して/usr/bin/mpirun -np 5 hostnameから、 fink mpirun がどこでも同じことを実行します: /path/to/fink/mpirun -np 5 hostname、2 つの MPI ランチャが非 MPI プログラムで動作することを確認するためだけです。次に、lddon my_program;を実行します。どのライブラリにリンクしていますか? mpirunこれらのライブラリに適したものを使用して、それが機能するかどうかを確認してください。

于 2011-03-03T13:53:40.613 に答える
0

ファイアウォールをチェックして、mpirun がインバウンドおよびアウトバウンド接続を確立できることを確認してください。

于 2011-03-04T15:31:27.357 に答える