c++ - すべての CUDA 関数を host device に変更します

Question

CUDA で存在する関数を使用したいのですが、多くのクラスと他の関数が含まれています。すべての関数の前に追加__host__ __device__するのは簡単です。それで、これを行う自動方法はありますか？または、どのように nvcc にすべての関数をコンパイルさせるの__device__ __host__ですか?

score 0 · Accepted Answer

基本的に、GPU プログラミングは大規模な並列処理がすべてです。これは、通常のシングルスレッドプログラミングとはまったく異なるパラダイムです。これらの関数を大きな配列の個々の要素に同時に適用したいだけでない限り、GPU にコーディングするメリットはありません。実際、GPU コアクロックはプロセッサよりもはるかに遅いです。主に CPU を対象として書かれた関数をシングルスレッドフレーバーで GPU にコンパイルすると、パフォーマンスが低下する可能性があります。問題を GPU パラダイムに再考する必要があります。

c++ - すべての CUDA 関数を __host__ __device__ に変更します

1 に答える 1

Related

Reference

c++ - すべての CUDA 関数を host device に変更します