5

4つのノードで単純なMPIプログラムを実行しようとしています。Centos5.5で実行されているOpenMPI1.4.3を使用しています。hostfile / machinefileを使用してMPIRUNコマンドを送信すると、出力が表示されず、空白の画面が表示されます。したがって、私は仕事を殺さなければなりません。

次の実行コマンドを使用します::mpirun--hostfile hostfile -np 4 new46

 OUTPUT ON KILLING JOB:
 mpirun: killing job...
 --------------------------------------------------------------------------
  mpirun noticed that the job aborted, but has no info as to the process that caused 
  that situation.
  --------------------------------------------------------------------------
  mpirun was unable to cleanly terminate the daemons on the nodes shown
   below. Additional manual cleanup may be required - please refer to
   the "orte-clean" tool for assistance.
   --------------------------------------------------------------------------
    myocyte46 - daemon did not report back when launched
    myocyte47 - daemon did not report back when launched
    myocyte49 - daemon did not report back when launched

これが私が4つのノードで実行しようとしているMPIプログラムです

   **************************

   if (my_rank != 0)
   {
    sprintf(message, "Greetings from the process %d!", my_rank);
    dest = 0;
    MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD);
   }
   else
   {
   for (source = 1;source < p; source++)
   {
    MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status);
    printf("%s\n", message);
   }

   ****************************

私のhostfileは次のようになります。

   [amohan@myocyte48 ~]$ cat hostfile
   myocyte46
   myocyte47
   myocyte48
   myocyte49
   *******************************

上記のMPIプログラムを各ノードで個別に実行したところ、コンパイルされて正常に実行されました。hostfileを使用すると、「デーモンが起動時にレポートを返さない」という問題が発生します。私は何が問題になるのかを理解しようとしています。

ありがとう!

4

1 に答える 1

1

これらの行は

myocyte46 - daemon did not report back when launched

かなり明確です-mpiデーモンを起動するか、後でそれらと通信するのに問題があります。したがって、ネットワーキングを検討し始める必要があります。これらのノードにパスワードなしでSSH接続できますか?sshバックできますか?MPIプログラムは別として、あなたはできますか

mpirun -np 4 hostname

そして何かを手に入れますか?

于 2011-07-09T17:34:15.933 に答える