4

GPUに計算を行わせたいので、「テクスチャ」のアップロードとダウンロードの速度を測定するトピックに興味があります。「テクスチャ」はGPUが処理する必要のあるデータだからです。

メインメモリからGPUメモリへの転送が好ましい方法であることを私は知っているので、処理するデータが多く、結果がほとんど読み戻されない場合にのみ、このようなアプリケーションが効率的であると期待しています。

とにかく、そのようなベンチマークアプリケーションはありますか?つまり、メインメモリ<>GPU転送スループットを測定するために...

編集(質問の明確化):

あなたが始めたアプリケーションがあったら、それは2つの数字を出しました:

  1. メインメモリとグラフィックカードメモリ間のmb/s転送速度、メインTOグラフから、テクスチャアップロード

  2. メインメモリとグラフィックカードメモリ間のmb/s転送速度、グラフからメイン、テクスチャダウンロード

もう一度、それを手に入れたいと思います。

まだ別の編集(何かを見つけた):

ここでhttp://www.benchmarkhq.ru/english.html?/be_mm.html(TexBenchを検索)は、スループットを一方向で測定するアプリです...

4

3 に答える 3

2

ホストからデバイスへのメモリ帯域幅を測定するにはbandwidthTest、CUDA SDKのサンプルを使用できます(CUDAサイトからダウンロード)。

于 2010-03-10T21:26:44.420 に答える
1

まず、グローバル(GPU)メモリとテクスチャの違いはキャッシュによって定義されます。テクスチャにはそれがありますが、グローバルメモリにはありません。

2番目:ホストから(GPU)デバイスへの転送速度は、テクスチャとグローバルメモリで同じです。

3番目:ホストから(GPU)デバイスへの転送速度は、GPUの生成によって異なり、PCI-expressバスとデータのサイズによって決まります。

たとえば、次を参照してください:http ://www.accelereyes.com/wiki/index.php?title=GPU_Memory_Transfer

于 2010-03-10T20:21:17.073 に答える
0

cudaプロファイルを使用して、メモリ転送時間など、cuda機能に費やされた時間を通知できます。非常に簡単な転送テストケースを作成して、それを測定できます。あなたがあなたの特定のテストケースを測定するとき、これは私の意見ではより良いでしょう。

CUDA_PROFILEとその使用方法を検索します。http://www.drdobbs.com/cpp/209601096?pgno=2

あなたの質問は少し理解するのが難しいです、あなたはホストとGPUの間の転送を測定したいですか(テクスチャキャッシュは実際には関連していません)またはカーネル内からのテクスチャ読み取り?

于 2010-03-10T18:20:40.137 に答える