CUDA ビジュアル プロファイラー バージョン 5 では、"gld/st_requested_throughput" がアプリケーションの要求されたメモリ スループットであることを知っています。ただし、ハードウェアの実際のスループットを見つけようとすると、「gld/st_throughput」と「dram_read/write_throughput」という 2 つのメトリックのペアが認定されているように見えるため、混乱します。実際のハードウェア スループットはどちらのペアですか? そして、もう一方は何として機能しますか?
質問する
497 次
1 に答える
1
gld/st_throughput
L1 および L2 キャッシュによって処理されるトランザクションが含まれます。dram_read/write_throughput
は、L2 とデバイス メモリ間のスループットです。そのため、各グローバル メモリ アクセスは に対してカウントgld/st_throughput
されますが、L1 キャッシュと L2 キャッシュの両方をミスしたリクエストのみが に対してカウントされますdram_read/write_throughput
。
カウンターの概要がよくわかりません。NVIDIAがそれを提供してくれることを願っています...
于 2012-12-12T14:45:37.860 に答える