4つのノードで単純なMPIプログラムを実行しようとしています。Centos5.5で実行されているOpenMPI1.4.3を使用しています。hostfile / machinefileを使用してMPIRUNコマンドを送信すると、出力が表示されず、空白の画面が表示されます。したがって、私は仕事を殺さなければなりません。。
次の実行コマンドを使用します::mpirun--hostfile hostfile -np 4 new46
OUTPUT ON KILLING JOB:
mpirun: killing job...
--------------------------------------------------------------------------
mpirun noticed that the job aborted, but has no info as to the process that caused
that situation.
--------------------------------------------------------------------------
mpirun was unable to cleanly terminate the daemons on the nodes shown
below. Additional manual cleanup may be required - please refer to
the "orte-clean" tool for assistance.
--------------------------------------------------------------------------
myocyte46 - daemon did not report back when launched
myocyte47 - daemon did not report back when launched
myocyte49 - daemon did not report back when launched
これが私が4つのノードで実行しようとしているMPIプログラムです
**************************
if (my_rank != 0)
{
sprintf(message, "Greetings from the process %d!", my_rank);
dest = 0;
MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD);
}
else
{
for (source = 1;source < p; source++)
{
MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status);
printf("%s\n", message);
}
****************************
私のhostfileは次のようになります。
[amohan@myocyte48 ~]$ cat hostfile
myocyte46
myocyte47
myocyte48
myocyte49
*******************************
上記のMPIプログラムを各ノードで個別に実行したところ、コンパイルされて正常に実行されました。hostfileを使用すると、「デーモンが起動時にレポートを返さない」という問題が発生します。私は何が問題になるのかを理解しようとしています。
ありがとう!