5

共有メモリはバンクに「ストライピング」されます。これは、銀行の競合という問題全体につながります。

質問:しかし、共有メモリに存在するバンク (「ストライプ」)の数 をどのように判断できますか?

(NVIDIA の "devtalk" フォーラムを調べてみると、ブロックごとの共有メモリが 16 のバンクに "ストライピング" されているようです。すべてのNVIDIA CUDA 対応カード?ランタイム API からこれを決定する方法はありますか? (たとえば、cudaDevicePropの下には表示されません)?実行時に手動で決定する方法はありますか?)

4

1 に答える 1