2

CUDA ビジュアル プロファイラー バージョン 5 では、"gld/st_requested_throughput" がアプリケーションの要求されたメモリ スループットであることを知っています。ただし、ハードウェアの実際のスループットを見つけようとすると、「gld/st_throughput」と「dram_read/write_throughput」という 2 つのメトリックのペアが認定されているように見えるため、混乱します。実際のハードウェア スループットはどちらのペアですか? そして、もう一方は何として機能しますか?

4

1 に答える 1

1

gld/st_throughputL1 および L2 キャッシュによって処理されるトランザクションが含まれます。dram_read/write_throughputは、L2 とデバイス メモリ間のスループットです。そのため、各グローバル メモリ アクセスは に対してカウントgld/st_throughputされますが、L1 キャッシュと L2 キャッシュの両方をミスしたリクエストのみが に対してカウントされますdram_read/write_throughput

カウンターの概要がよくわかりません。NVIDIAがそれを提供してくれることを願っています...

于 2012-12-12T14:45:37.860 に答える