困ったので以下質問させていただきます...
さまざまなサイトや論文で、ケプラー アーキテクチャによってスレッドあたりのレジスタ数が増加したという記述を見つけましたが、私の GTX680 では、RegsPerBlock が 65536 であるため、1024 スレッドの場合は 64 reg になるため、これは正しくないようです。何が欠けていますか?..将来、スレッドごとのレジスタが増える予定はありますか?
よろしくダニエル
困ったので以下質問させていただきます...
さまざまなサイトや論文で、ケプラー アーキテクチャによってスレッドあたりのレジスタ数が増加したという記述を見つけましたが、私の GTX680 では、RegsPerBlock が 65536 であるため、1024 スレッドの場合は 64 reg になるため、これは正しくないようです。何が欠けていますか?..将来、スレッドごとのレジスタが増える予定はありますか?
よろしくダニエル
Kepler アーキテクチャには、sm_30 と sm_35 の 2 つのバリアントがあります。GTX 680 カードは、sm_30 アーキテクチャを実装する GK104 GPU に基づいています。このアーキテクチャにはスレッドごとに 64 個のレジスタがあり、そのうち 63 個はユーザー コードで使用でき、1 個は専用のゼロ レジスタです。K20 のような将来の GK110 ベースのパーツは、スレッドごとに 256 個のレジスタを提供する sm_35 アーキテクチャを実装し、そのうち 255 個をユーザー コードで使用できます (1 個は専用のゼロ レジスタです)。