0

コマンドラインで CUDA Profiler を使用しようとしています。DRAM_Reads と DRAM_Writes に興味があります。CUDA_PROFILE_LOG ファイルで次のカウンターを提供しています。

fb_subp0_read_sectors
fb_subp0_write_sectors
fb0_subp0_read_sectors
fb0_subp0_write_sectors
fb1_subp0_read_sectors
fb1_subp0_write_sectors

しかし、cuda_profile ファイルに次のようなエラーがあることに気付きました。

NV_Warning: Ignoring the invalid profiler config option: fb0_subp0_read_sectors
NV_Warning: Ignoring the invalid profiler config option: fb0_subp0_write_sectors
NV_Warning: Ignoring the invalid profiler config option: fb1_subp0_read_sectors
NV_Warning: Ignoring the invalid profiler config option: fb1_subp0_write_sectors

fb_subp0_read_sectors および fb_subp0_write_sectors カウンターから取得した値は、NVidia Visual Profiler から取得した値と等しくありません。これは、おそらく構成ファイルに正しいカウンターを渡していないためです。GPUはTesla M2050でCUDA 4.1を採用。コマンド ラインで DRAM_Reads と DRAM_Writes を取得するにはどうすればよいですか?

EDIT:少し読んだ後、GPUはfb0/1 ...またはfb ...カウンターを持つことができると思います。しかし、私が持っていても:

fb_subp0_read_sectors
fb_subp0_write_sectors
fb_subp1_read_sectors
fb_subp1_write_sectors

警告が表示されます:

NV_Warning: Counter 'fb_subp1_read_sectors' is not compatible with other selected counters and it cannot be profiled in this run.
NV_Warning: Counter 'fb_subp1_write_sectors' is not compatible with other selected counters and it cannot be profiled in this run.

ありがとう、サヤン

4

1 に答える 1

2

ハードウェアの制約により、1 回の実行ですべてのカウンターをプロファイリングできるわけではありません。

警告メッセージに従って、最初の実行で最初の 2 つのカウンターをプロファイリングしてから、2 回目の実行で最後の 2 つのカウンターをプロファイリングしてみてください。

于 2012-07-11T03:49:28.593 に答える