ブロックごとのデータ配列があります。cudaグリッド内にN個のブロックと、サイズNのデータ「block_data []」の定数配列があります。
したがって、特定のブロック 'X' 内のすべてのスレッドは、block_data[X] に 1 回だけアクセスし、その値で何かを行います。
私の質問は次のとおりです。このブロードキャスト方式は効率的に機能しますか? そうでない場合、どのようなアプローチをとるべきですか?
コメントの後に編集: 定数メモリに関する私の唯一の問題は、64K を超えるブロックを持つ可能性があるため、サイズが限られていることです。それは64KB以上を意味します
よろしく