こんにちは、私はgputeslac2050固有のxeon4coreを持っています
CUDAカーネルとシリアルCPUコードを使用しています。cpu_codeを使用すると、処理時間は40秒になります。CUDA_kernelを使用すると、同じ問題が2秒で処理されます。
スピードアップウィキを計算したい:
CPU:s(4core)= 40/2 CUDA:s(448core)= 40/2 ?????
私は混乱しています、あなたは私を助けることができますか?
こんにちは、私はgputeslac2050固有のxeon4coreを持っています
CUDAカーネルとシリアルCPUコードを使用しています。cpu_codeを使用すると、処理時間は40秒になります。CUDA_kernelを使用すると、同じ問題が2秒で処理されます。
スピードアップウィキを計算したい:
CPU:s(4core)= 40/2 CUDA:s(448core)= 40/2 ?????
私は混乱しています、あなたは私を助けることができますか?