私はグーグルで検索してきましたが、ここからリンクされている Tech Briefs の 1 つで、Compute Capability 3.0 の新しい動的並列処理の些細な例しか見つけることができませんでした。HPC 固有のカードは、おそらく来年の今頃 (国立研究所が入手した後) まで入手できないことは承知しています。そして、はい、彼らが示した単純な例はあなたを理解させるのに十分であることを理解していますが、より楽しい.
私が見逃した他の例はありますか?
手間を省くために、技術概要に記載されている例全体を次に示します。
__global__ ChildKernel(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel<<<16, 1>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
// Recursion is also supported
__global__ RecursiveKernel(void* data){
if(continueRecursion == true)
RecursiveKernel<<<64, 16>>>(data);
}
編集: GTC トークCUDA プログラミング モデルの新機能は、主に CUDA 5 の新しい動的並列処理に焦点を当てています。リンクにはビデオとスライドがあります。まだおもちゃの例にすぎませんが、上記の技術概要よりもはるかに詳細です。