インテル Xeon Phi では、コアごとに 32 個の 512 ビット幅のベクトル レジスタがあります。各ベクトル レジスタは、1 サイクルあたり 16 の単精度浮動小数点演算を実行できます。また、1 サイクルで 2 つの操作を実行できます (V パイプで 1 回、U パイプで 1 回)。
ベクトル レジスタで実行されるベクトル乗算とは別に、1 クロック サイクルで実行できるスカラー乗算の数を知りたいです。
そこにはいくつかの誤解があります。コアごとに 1 つのベクトル ユニットがあります。レジスタは値を格納しますが、計算はしません。したがって、コアあたりのサイクルごとに 1 512 バイト幅のベクトル操作を発行できます。スカラー乗算も 1 サイクルで実行できます。同時に発行することはできません。u&v パイプを使用すると、1 つのベクトルまたはスカラー操作を発行してから、別のパイプでメモリ操作を発行できます。融合乗算加算 (MADD) 命令をサイクルごとに実行することもできます。これにより、コアごとにサイクルごとに 2 つのベクトル演算を効果的に行うことができます。