高性能 GPU 操作を使用して、次のコードの M を N 倍し、結果を P に配置できる CUBLAS の非常に基本的な行列乗算の例を探しています。
float M[500][500], N[500][500], P[500][500];
for(int i = 0; i < Width; i++){
for(int j = 0; j < Width; j++)
{
M[i][j] = 500;
N[i][j] = 500;
P[i][j] = 0;
}
}
これまでのところ、CUBLAS を使用して任意の種類の行列乗算を行うために見つけたほとんどのコードは (一見?) 過度に複雑です。
GPU での行列乗算と CPU での行列乗算のパフォーマンスを学生が比較できる基本的なラボを設計しようとしています。おそらく GPU でのパフォーマンスが向上しています。