私はCUDA
プログラミングが初めてです。ここで、対処すべき問題があります。一連のデータセットを処理するために CUDA 並列プログラミングを使用しようとしています。また、各データセットに対して、実行する必要のある行列計算がいくつかあります。
私のデザインは次のようなものです:
各データセットは互いに独立しており、処理方法も同じであるため、N 個のスレッドを起動して各データセットを処理します。
1の各スレッドで、新しい関数を使用したいのですが、この関数は行列計算であるため、カーネルのようにも機能します...たとえば、Mスレッドを呼び出して行列計算を並列処理します..
それが可能かどうかは誰にもわかりませんか?