共有メモリ配列を次のように宣言する簡単なカーネルを作成しました。
extern __shared__ float As[100];
カーネルの起動時に、共有メモリの number_of_bytes を指定します。カーネルを (PTX に) コンパイルしているときに、「予期しないアドレス空間」というエラーが表示されます。私はsvn(進行中の3.3)からLLVMのかなり新しいバージョンを使用しています。ここで私が間違っていることはありますか?問題は extern キーワードにあるようですが、他にどのように指定すればよいでしょうか (共有メモリ)。別の LLVM ビルドを使用する必要がありますか?
構成 CUDA 5.0 、Nvidia Tesla C1060