私はこのサイトや他のサイトを見回しましたが、何もうまくいきませんでした. 私は自分の特定のケースについて質問を投稿することに頼っています。
多数のマトリックスがあり、カーネルを使用して GPU がそれらすべてに対して同じ操作を実行できるようにすることが目標です。カーネルを動作させることができると確信していますが、cudaMalloc / cudaMemcpy を動作させることができません。
いくつかのフロートを指す要素と呼ばれるメンバーを持つ Matrix 構造体へのポインターがあります。cuda以外のすべてのmallocを問題なく実行できます。
あらゆる/すべての助けに感謝します。
コード:
typedef struct {
int width;
int height;
float* elements;
} Matrix;
int main void() {
int rows, cols, numMat = 2; // These are actually determined at run-time
Matrix* data = (Matrix*)malloc(numMat * sizeof(Matrix));
// ... Successfully read from file into "data" ...
Matrix* d_data;
cudaMalloc(&d_data, numMat*sizeof(Matrix));
for (int i=0; i<numMat; i++){
// The next line doesn't work
cudaMalloc(&(d_data[i].elements), rows*cols*sizeof(float));
// Don't know if this works
cudaMemcpy(d_data[i].elements, data[i].elements, rows*cols*sizeof(float)), cudaMemcpyHostToDevice);
}
// ... Do other things ...
}
ありがとう!