-3

nx1 項目を持つベクトル V と nxm 項目を持つ行列 M があります。V と M のすべての列を CUDA で合計したい。問題を回避するのに役立つ THRUST または CUBLAS の方法はありますか?

4

1 に答える 1

1

ここで私が2つの反対票で行ったこと

thrust::device_vector<float> dummy_y(N,1);
alpha = 1.0f;
beta = 0.0f;
stat = cublasSger_v2(handle,K,N,&alpha,thrust::raw_pointer_cast(&dummy_y[0]),1,thrust::raw_pointer_cast(&A_sum_vec_d[0]),1,thrust::raw_pointer_cast(&C_d[0]),K);

行列のサイズのように、1 でいっぱいの行ベクトルを乗算して列ベクトルを複製し、 で合計しcublasSgerます。statコードの実行ステータスを保持しているため、考えられるエラーをチェックできます。

于 2013-06-28T17:13:48.503 に答える