現在、C ++プログラムをCUDAコードに変換しており、プログラムの一部が高速フーリエ変換を実行しています。もともとFFTWを実行していましたが、カーネルで呼び出せないので、cufftを使ってその部分を書き直しましたが、同じことがわかります!
CUDAカーネル内で実行されるFFTはありますか?
__device__
fftwライブラリに追加できますか?
ホストでFFTを初期化または呼び出す必要がないようにしたいと思います。gpuタイプの関数が存在する場合は、それを完全に使用したいと思います。