私はCUDAと並列プログラミングが初めてです。CUDA で二重並列部分を実行したいのですが、誰か助けてください。ここに投稿して申し訳ありませんが、少し混乱しており、適切なチュートリアルやヘルプが見つかりませんでした. CUDA で並列に動作する関数を作成したいのですが、その関数から並列に呼び出される CUDA の別の関数を作成したいのですが、CUDA のカーネル関数では可能ですか?
編集
たとえば、2 つのカーネル関数がmy_prog
あり、my prog_1
このように呼び出しています
main_function
{
my_prog<<core,threads>>();
}
my_prog()
{
//here i want to call my_prog_1 in parallel
my_prog_1<<core,threads>>();
}