0

for reduction()CUDA でOpenMP に相当するものを使用する方法を理解しようとしています。私はオンラインでいくつかの調査を行いましたが、試したことはどれもうまくいきませんでした。コード:

    #pragma omp parallel for reduction(+:sum)
    for (i = 0; i < N; i++)
    {
        float f = ...  //store return from function to f
        out[i] = f;    //store f to out[i]
        sum += f;      //add f to sum and store in sum
    }

for reduction()はOpenMPで何をするか知っています....それはforループの最後の行を可能にします。しかし、CUDA を使用して同じことを表現するにはどうすればよいでしょうか?

ありがとう!

4

1 に答える 1

0

CUDA に付属する STL にインスパイアされたライブラリであるThrustを使用します。リダクションの実行方法の例については、クイック スタート ガイドを参照してください。

于 2012-12-09T23:56:23.823 に答える