1

3D サーフェスを使用して 3D cudaArray を読み書きするカーネルのプロファイルを作成しようとしています。

残念ながら、nvprof は、テクスチャの読み取りまたは書き込み、またはキャッシュ アクティビティなどについてはまったく何も表示しません。

また、非常に貧弱なメモリアクセスなども示しています。

アプリケーションは完全に機能するため、表面の読み取りと書き込みの呼び出しは明らかに機能しています。

これに関するアイデアはありますか?おそらく、nvprof はまだ表面活性を示すことができないのでしょうか?

4

1 に答える 1