mpi - 一部のデータが転送された後に MPI_Bcast がハングする

Question

7 ノードクラスタで大きな行列の変換を実行するアプリケーションを実行しています。ノードは QDR 40 Gbit Infiniband 経由で接続されます。Open MPI 1.4.3 がシステムにインストールされています。

特定の行列変換では、各アルゴリズムステップで 1 つのノードがデータを送信し、他のすべてのノードが受信するような方法で、ノード間で大規模なデータ交換が必要になります。プロセスの数は、使用されるノードの数と同じです。私は MPI に比較的慣れていないと言わざるを得ませんが、これを実行する理想的な方法は MPI_Bcast を使用することであると思われました。

それほど大きくないマトリックスでは、すべてがうまくいきました。ただし、マトリックスのサイズが大きくなると、ある時点でアプリケーションがハングし、永遠にそこにとどまります。

完全にはわかりませんが、コードにエラーはないようです。MPI_Bcast の特定の呼び出しの前に未完了の集合操作があるかどうかを確認するために詳細にトレースしましたが、すべて問題ないようです。また、その特定の呼び出しに対して、メッセージのタイプとサイズだけでなく、root がすべてのプロセスで正しく設定され、もちろん、MPI_Bcast がすべてのプロセスで呼び出されます。

また、これがいつ発生するかを把握するために、多くのシナリオ (さまざまなサイズのマトリックスでアプリケーションを実行し、プロセス数を変更する) を実行しました。観察できることは次のとおりです。

同じサイズの行列の場合、プロセスの数を決定すると、アプリケーションは正常に終了します
ただし、指定された数のプロセスでは、アプリケーションはわずかに大きなマトリックスでハングします
プログラムがハングしている特定の行列サイズとプロセス数について、各 MPI_Bcat 呼び出しでメッセージのサイズを 2 回縮小すると (もちろん、結果は正しくありません)、ハングすることはありません。

そのため、MPI が使用するいくつかのバッファーに問題がある可能性があり、デフォルトの MCA パラメーターを変更する必要があるように思えますが、前述したように、MPI プログラミングの経験があまりなく、見つけられませんでした。この問題の解決策。したがって、問題は、誰かが同様の問題を抱えているかどうかであり、適切な MCA パラメータを設定することでこれを解決できるかどうか、または他の解決策や説明を知っているかどうかです。

score 0 · Accepted Answer

@Hristo が既に述べたように、Open MPI Web サイトから新しい OMPI バージョンを使用することから始めてください。現在の安定バージョンは 1.6.5 であるため、これを取得する必要があります。おそらく、これで問題は解決します。

問題が解決しない場合は、OMPI ユーザーメーリングリストで議論することをお勧めします。そこにいる人々はすぐに対処します。

それでも MCA パラメーターを使用したい場合は、次のパラメーターから始めることをお勧めします。

--mca btl_openib_flags <hex value>
--mca mpi_leave_pinned <0|1>

mpi - 一部のデータが転送された後に MPI_Bcast がハングする

1 に答える 1

Related

Reference