CUDAを使用してカーネルコードで__cos(x)
(およびそれぞれ)をどのように使用するのか疑問に思っていました。__sin(x)
そのようなデバイス関数があることをCUDAマニュアルで調べましたが、それを実装すると、コンパイラはデバイスでホスト関数を呼び出すことができないとだけ言います。
ただし、2 つの姉妹関数がcosf(x)
あり、後者は SFU 上で実行され、元の関数__cosf(x)
よりも全体的にはるかに高速であることがわかりました。cosf(x)
もちろん、コンパイラは機能について文句を言いません__cosf(x)
。
不足しているライブラリはありますか? この三角関数について間違っていますか?