2.x デバイスとのデバイスでのバンク競合とは何ですか? CUDA C プログラミング ガイドを理解しているように、2.x デバイスでは、2 つのスレッドが同じ共有メモリ バンク内の同じ 32 ビット ワードにアクセスしても、バンクの競合は発生しません。代わりに、単語がブロードキャストされます。2 つのスレッドが同じ 32 ビット ワードを同じ共有メモリ バンクに書き込む場合、1 つのスレッドだけが成功します。
オンチップ メモリは 64 KB (共有メモリは 48 KB、L1 は 16 KB、またはその逆) であり、32 バンクで構成されているため、各バンクは 2 KB で構成されていると想定しています。したがって、2 つのスレッドが同じ共有メモリ バンク内の 2 つの異なる 32 ビット ワードにアクセスすると、バンクの競合が発生すると思います。これは正しいです?