0

64 ビット整数を使用する場合、CUDA は SM35 でファンネル シフト命令を内部的に生成しますか? 私のカーネルは、通常のshl.b64命令を示す PTX への SM35 ターゲットでコンパイルされます。この PTX 出力はまだ完全には最適化されておらず、モジュールが読み込まれると ( cuModuleLoad ) ネイティブ アーキテクチャ コードが生成されることは承知しています。

 shl.b64     %rd5, %rd4, 16;
4

1 に答える 1