1

現時点では、カーネルの占有率を向上させ、占有率計算ツールとSDKサンプルdevicequeryから取得したデバイス情報を使用しようとしています。ブロックとストリーミングマルチプロセッサ(sm)の宣言が少し異なるのではないかと思います。SDKサンプルでは、​​次のように呼ばれます

ブロックあたりの共有メモリの合計量

ブロックごとに使用可能なレジスタの総数

しかし、占有計算機では、これらの情報はsmごとであり、これは私にとってより理にかなっています。

それはSDKサンプルの間違った宣言だけですか?

4

1 に答える 1

0

仰るとおりです。

共有メモリとレジスタはハードウェアリソースですが、ブロックはソフトウェアプログラミングモデルの概念です。

一方、ブロックが使用できる共有メモリの最大量は、GPUデバイスのマルチプロセッサあたりの共有メモリの合計量に等しいと言えます。

公式のドキュメントCUDAプログラミングガイドでは、「コンピューティング機能」のセクションに示されているように、「マルチプロセッサごとの共有メモリ」という用語も使用しています。

于 2013-01-24T08:24:09.327 に答える