cuda - cuda とファイルスコープ

Question

私は自分のプロジェクトから、__constant__メモリを使用するときにcudaがファイルスコープリンケージを持っていることを知っています。つまり、実行したのと同じファイル内で定数メモリを使用する必要がありますcudaMemcpyToSymbol。では、cuda がファイルスコープリンクを使用する他のストレージ/メモリタイプは何ですか? にも使えると思いますtexture。しかし、__shared__メモリとは何ですか？

score 2 · Accepted Answer

最初のポイントは、従来の CUDA コンパイルモデルでは、すべてのデバイスシンボルのスコープ要件が翻訳単位スコープであることです。そして、少なくとも少なくとも

__global__ 関数
__デバイス__ 関数
__テクスチャ__ オブジェクト
__constant__ メモリ
__shared__ メモリが extern として宣言されました
__device__ シンボル

これらはすべて、ランタイムが正しく機能するために使用される同じ翻訳単位で定義する必要があります。根本的な理由は、すべてが機能するためには、上記のリストのすべてのオブジェクトが同じ CUDA モジュール (これはドライバー API の概念です) に発行される必要があるためです。

CUDA 5 では、実質的に静的リンケージモデルである個別のコンパイルモードが導入されています。これは、シンボルを同じ変換単位で定義する必要がなく、前方宣言することができ、リンカーがデバイスコードリンケージパス中にシンボルマッチングを処理することを意味します。

cuda - cuda とファイルスコープ

1 に答える 1

Related

Reference