Arch Linux ARM (より具体的には Raspberry Pi クラスター上) で mpi4py (1.3.1) と openmpi (1.8.6-1) を使用して MPI アプリケーションを構築しています。3 つのノード (4 つのプロセス) でプログラムを正常に実行しました。新しいノードを追加しようとすると、次のようになります。
Host key verification failed.
--------------------------------------------------------------------------
ORTE was unable to reliably start one or more daemons.
This usually is caused by:
* not finding the required libraries and/or binaries on
one or more nodes. Please check your PATH and LD_LIBRARY_PATH
settings, or configure OMPI with --enable-orterun-prefix-by-default
* lack of authority to execute on one or more specified nodes.
Please verify your allocation and authorities.
* the inability to write startup files into /tmp (--tmpdir/orte_tmpdir_base).
Please check with your sys admin to determine the correct location to use.
* compilation of the orted with dynamic libraries when static are required
(e.g., on Cray). Please check your configure cmd line and consider using
one of the contrib/platform definitions for your system type.
* an inability to create a connection back to mpirun due to a
lack of common network interfaces and/or no route found between
them. Please check network connectivity (including firewalls
and network routing requirements).
面白いことに、同じノードを使用しているため、ssh キーは問題ありません (ホスト ファイルの任意のエントリを削除し、新しいノードを追加すると機能するので、問題はないと確信しています。 ssh の設定が間違っている (5 つのプロセスを使用している場合にのみ発生します)。
これは何らかのライブラリのバグでしょうか?
ここに私のホストファイルがあります
192.168.1.26 slots=2
192.168.1.188 slots=1
#192.168.1.202 slots=1 If uncommented and run with -np 5, it will raise the error
192.168.1.100 slots=1
前もって感謝します!