cuda - デバイス関数から cublas 関数を呼び出すことはできますか?

翻译自：https://stackoverflow.com/questions/29142800 2015-03-19T11:00:18.500

1636 次

ここでRobert Crovella は、デバイスコードから cublas ルーチンを呼び出すことができると述べました。動的並列処理を使用し、計算機能 3.5 でコンパイルしていますが、デバイス関数から Cublas ルーチンを呼び出すことができません。「デバイス/グローバル関数からホスト関数を呼び出すことは許可されていません」というエラーが常に表示cublsAllocされますcublasGetVectorcublasSetVectorcublasDgemm

私のコンパイルとリンクのコマンド:

  
nvcc -arch=sm_35 -I. -I/usr/local/cuda/include -c -O3 -dc GPUutil.cu -o ./build/GPUutil.o   
nvcc -arch=sm_35 -I. -I/usr/local/cuda/include -c -O3 -dc DivideParalelo.cu -o ./build/DivideParalelo.o
nvcc -arch=sm_35 -I. -I/usr/local/cuda/include -dlink ./build/io.o ./build/GPUutil.o ./build/DivideParalelo.o -lcudadevrt -o ./build/link.o
icc -Wwrite-strings ./build/GPUutil.o ./build/DivideParalelo.o ./build/link.o -lcudadevrt -L/usr/local/cuda/lib64  -L~/Intel/composer_xe_2015.0.090/mkl/lib/intel64  -L~/Intel/composer_xe_2015.0.090/mkl/../compiler/lib/intel64  -Wl,--start-group ~/Intel/composer_xe_2015.0.090/mkl/lib/intel64/libmkl_intel_lp64.a ~/Intel/composer_xe_2015.0.090/mkl/lib/intel64/libmkl_sequential.a ~/Intel/composer_xe_2015.0.090/mkl/lib/intel64/libmkl_core.a ~/Intel/composer_xe_2015.0.090/mkl/../compiler/lib/intel64/libiomp5.a -Wl,--end-group -lpthread  -lm  -lcublas -lcudart   -o DivideParalelo

cuda - デバイス関数から cublas 関数を呼び出すことはできますか?

1 に答える 1

Related

Reference