問題タブ [nsight-compute]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
132 参照

cuda - Tensor コアの使用時に共有メモリの読み込みが登録されない

Turing アーキテクチャで設計された GPU で Tensor コアを使用して、サイズ 8x8 のブロックを乗算しようとしています。そのために、WMMA API とサイズ 16x16 のフラグメントを使用しています。私の推測では、フラグメントにロードされたほとんどのデータは有用な情報を表していないため、共有メモリの帯域幅が浪費されるというものでした。数値化しようとしているときに、次の問題に遭遇しました: wmma::load_matrix_sync を使用した共有メモリのロードは、Nsight コンピューティングでも報告されません。それをテストするために、私はこのカーネルを使用しています:

Nsight Compute は共有メモリ ストアを報告しますが、ロードは報告しません。ここで何が起きてるの?いくつかのバリエーションを試しましたが、それでも負荷が 0 と表示されます。

0 投票する
1 に答える
327 参照

cuda - Nsight コンピューティングは、「プロファイリングはこのデバイスではサポートされていません」と言います - なぜですか?

NVIDA GTX 1050 Ti GPU (計算能力 6.1) を搭載したマシンがあり、CUDA 11.4 で構築したプログラムでカーネルをプロファイリングしようとしています。私の OS ディストリビューションは Devuan GNU/Linux 4 Chimaera (~= Debian 11 Bullseye) です。

NSight Compute がプログラムを開始し、API 呼び出しの後に API 呼び出しを表示しますが、最初のカーネル起動時に、API 呼び出しリストの詳細列にエラー メッセージが表示されます。

なんで?デバイスの何が問題になっていますか? 権限の問題ですか?