Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
巨大な行列があり、各セルが隣接するセルから数値の合計を取得するだけで、行列の出力を入力行列と同じサイズにする必要があります。
CUDA を使用して GPGPU プラットフォームでアプローチする方法を教えてもらえますか?
合計を実行できるように、隣接するすべてのセルの値を(パラメーターとして)カーネルに渡す必要があります。パラメータリストと直後のコードでこのようなもの:(int actualCellvalue、int adj1、int adj2、int adj3 ...)
{actualCellvalue = actualCellvalue + adj1 + adj2 + adj3 ....; }
これは間違っているかもしれませんが、それは私があなたの本当に短い説明から理解したことです。
よろしく、ピーター