MatlabからCUDAコードをプロファイリングする必要があります。パフォーマンスを向上させるために、matlabコードの一部をCUDAに変換しています。私はCUDAを呼び出すmexFunctionを呼び出すことによってこれを行いました。matlabfeval関数は十分な制御を提供しません。VSを介してmexFunctionを実行してこれをデバッグできますが、これが問題であると信じているため、カーネルもデバッグする必要があります。
だから、私の質問は、それを呼び出すmatlab関数を実行するときにプロファイラーを介してCUDAコードを実行するにはどうすればよいですか?
CUDA関数へのすべての入力の値をハードコーディングすることは実用的ではありません。
TeslaC2050GPUカードを搭載したWindows764ビットでMatlab2012a64ビットを実行しています