A
現在、スケーラビリティに深刻な問題を引き起こしている 1 つのプロセス ( と呼びます) を持つ MPI アプリケーションがあります。現在、他のすべてのプロセスはMPI_Recv
、その 1 つのプロセスが情報を送信するのを待っています。
できるだけ少ない労力でこれを高速化したいので、OpenMP の並列化プロセスを使用することを考えていましたA
。これは実用的ですか?
ノードを共有する他のプロセスA
は にあるMPI_Recv
ため、そのノードのすべてのリソースを使用してプロセスで作業できますかA
、またはそれをMPI_Recv
防ぐことができますか?
A
OpenMP を使用するもう 1 つの利点は、処理に時間がかかるため、メモリを共有できることです。
ところで、プロセッサがMPI_Send
ではなく で待機している場合、何か変化はありMPI_Recv
ますか?