C で MPI を使用して Fox アルゴリズムの実装をコーディングしています。既に global_matrix を小さなブロックに分割しています。したがって、各プロセスには行列 A と行列 B の小さなブロックがあります。ただし、Fox アルゴリズムの実装方法を理解するのに苦労しています。インターネット上で見つかった多くのコードは、次のことを行っています。
わからないこと : 最後のスライドには、アルゴリズムを実装する C コードがあります。しかし、一時配列は適切に初期化されていないようで、MPI_Bcast() や行列の乗算で使用すると奇妙な動作が発生するはずです。
アルゴはほぼ機能していると思いますが、結果の値は間違いなく間違っています。
(必要に応じてコードを提供できます)
ご回答ありがとうございます。