3D サーフェスを使用して 3D cudaArray を読み書きするカーネルのプロファイルを作成しようとしています。
残念ながら、nvprof は、テクスチャの読み取りまたは書き込み、またはキャッシュ アクティビティなどについてはまったく何も表示しません。
また、非常に貧弱なメモリアクセスなども示しています。
アプリケーションは完全に機能するため、表面の読み取りと書き込みの呼び出しは明らかに機能しています。
これに関するアイデアはありますか?おそらく、nvprof はまだ表面活性を示すことができないのでしょうか?