mpirun
OS Xでシングルマシンモードで使用するのに問題があります。を使用してプログラムを実行mpirun -np 5 my_program
すると、次のエラー出力が表示されます。
[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/pls/base/pls_base_orted_cmds.c at line 275
[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/pls/rsh/pls_rsh_module.c at line 1158
[...-MacBook-Pro.local:85936] [0,0,0] ORTE_ERROR_LOG: Timeout in file /SourceCache/openmpi/openmpi-8/openmpi/orte/mca/errmgr/hnp/errmgr_hnp.c at line 90
mpirun noticed that job rank 1 with PID 85940 on node ...-MacBook-Pro.local exited on signal 6 (Abort trap).
2 additional processes aborted (not shown)
どうやら、デフォルトではマシンへの接続にmpirun
使用されます。rsh
代わりに使用してみssh
ましたが、役に立ちませんでした。
mpirun --mca pls_rsh_agent ssh -np 5 my_program
次に、共有メモリ(sm
)BTLを使用してみましたが、どちらも役に立ちませんでした。
mpirun --mca btl self,sm -np 5 my_program
最後に、マシンファイルを使用して、使用するだけであることを指定しようとしましたがlocalhost
、どちらも役に立ちませんでした。
mpirun -np 5 -machinefile machinefile.local my_program
ここでは、(単一の)最初の行にmachinefile.local
のみ含まれています。localhost
上記のすべての場合で、上記のタイムアウトエラーが発生します。
また、Mac OS Xファイアウォールが実行されておらず、マシンにSSH接続できることを確認しました。