3

グラフィックス ハードウェアの理論上のピーク パフォーマンスを計算したいと考えています。うーん、実際には計算を理解したいです。

AMD Radeon HD 6670 の例: AMD Accelerated Parallel Processing Programming Guide ( http://developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf ) の 6-42 ページの中ほどで、ストリーム コアの数を取得するように指示されています ( 96)、各ストリーム コアのサイクルあたりの操作数を掛けて (5 になる単精度の ADD を考えてみましょう)、それをコア クロック (800 MHz) で掛けます。その結果、次のようになります。

96 * 5 FLOPS * 800MHz = 384,000 MFLOPS = 384 GFLOPS

まったく同じドキュメントの D-4 ページで、この特定のデバイスのピーク スループットは 768 GFLOPS であることがわかりました。これは、私が計算した値の 2 倍です。ウィキペディアと AMD のホームページには同じことが記載されています。

だから私の質問は次のとおりです。

4

2 に答える 2

4

AMD ハードウェアについてはよくわかりませんが、NVIDIA は MAD (multiply-add) 操作を 2 つのフロップとしてカウントしたことを覚えています。MAD は 1 サイクルで実行されるため、理論上のパフォーマンスは 2 倍になります。

于 2013-09-15T17:08:09.063 に答える