A現在、スケーラビリティに深刻な問題を引き起こしている 1 つのプロセス ( と呼びます) を持つ MPI アプリケーションがあります。現在、他のすべてのプロセスはMPI_Recv、その 1 つのプロセスが情報を送信するのを待っています。
できるだけ少ない労力でこれを高速化したいので、OpenMP の並列化プロセスを使用することを考えていましたA。これは実用的ですか?
ノードを共有する他のプロセスAは にあるMPI_Recvため、そのノードのすべてのリソースを使用してプロセスで作業できますかA、またはそれをMPI_Recv防ぐことができますか?
AOpenMP を使用するもう 1 つの利点は、処理に時間がかかるため、メモリを共有できることです。
ところで、プロセッサがMPI_Sendではなく で待機している場合、何か変化はありMPI_Recvますか?