行列の要素を計算する必要があります (例については下の図を参照してください6*8
)。行列の要素には依存関係があるため、t1
最初に の値を計算し、次に にt2
依存するt1
の値を計算し、値にt3
依存する の値を計算する必要がありt2
ます。
CUDAで行列要素を計算するには? カーネル呼び出しを 1 つだけ使用して、すべての値を計算する____syncthreads()
必要がありますか?それとも副対角線の行列要素の計算を別のカーネルで実行する必要がありますか?
行列の要素を計算する必要があります (例については下の図を参照してください6*8
)。行列の要素には依存関係があるため、t1
最初に の値を計算し、次に にt2
依存するt1
の値を計算し、値にt3
依存する の値を計算する必要がありt2
ます。
CUDAで行列要素を計算するには? カーネル呼び出しを 1 つだけ使用して、すべての値を計算する____syncthreads()
必要がありますか?それとも副対角線の行列要素の計算を別のカーネルで実行する必要がありますか?