2 つの合計を実行するとします。1 つは 10 個のスカラー変数の合計で、もう 1 つは次元が 10 × 10 の 2 次元配列のペアの行列の合計です。ここでは、行列の合計のみが並列化可能であると仮定しましょう。10 プロセッサと 40 プロセッサでは、どの程度の速度向上が得られますか?
私の理解:
10x10 行列 + 10 スカラー変数 = 110t
10 プロセッサの場合、(100/10)t + 10t = 20t
スピードアップ=110/20=5.5;
40 プロセッサの場合、(100/40)t + 10t = 12.5t
スピードアップ=110/12.5=8.8;
ソリューション ブックには、10 個のプロセッサで約55%の潜在的な高速化が得られると記載されていますが、40個のプロセッサでは22%しか得られません。
55% は理解できますが、その 22% はどのようにして得られるのでしょうか?