2

openMPI を使用して比較的小さなクラスター (36 コア) をセットアップしようとしていますが、小さな問題が発生しました。すべての openMPI ライブラリとすべての依存関係がインストールされ、正しく実行されています (ローカルホストとして各コンピューターで hello world MPI プログラムを実行できます)。問題は、複数のコンピューターでプログラムを一緒に実行する方法に関するドキュメントがあまり見つからないことです。mpirun --hostfile コマンドは実行できますが、ジョブを実行するたびにホスト ファイルを指定する必要はありません。さらに、将来のユーザーは、クラスター上のすべての IP アドレスに常にアクセスできるわけではありません。彼らと私は、問題なく mpirun -np 20 programFile を実行できることを期待しています。この時点から何をする必要があるかについて、誰かがガイダンスを提供できますか? 公平を期すために、私は' 大学で MPI を使って並列プログラムを書いたクラスを 1 つだけ取ったことがありますが、openMPI を使って新しいクラスターをセットアップする方法は教えてくれませんでした。皆さんからのアドバイスに感謝します。検索でこのガイドを見つけましたMPICH_Cluster_Setupは、openMPI である場合に最適です。openMPI に関する同様のガイドはありますか?

4

1 に答える 1

2

Torque、SLURM、または SGE などのクラスター スケジューラを使用する必要があります (すべて無料/FOSS)。これらにより、ユーザーは自分の使用のためにノードを予約し、MPI を開いてそのユーザーのジョブに使用するノードを指示するようにすべて「会話」できます (ホストファイルを使用する必要がないように)。

MPICH クラスターのセットアップ ドキュメントによると、これはオープン MPI に必要なものとほぼ同じですが、最後に MPD をセットアップする必要はありません (とにかく、MPICH は MPD を廃止しました)。

于 2012-03-08T15:07:46.710 に答える