グラフィックス ハードウェアの理論上のピーク パフォーマンスを計算したいと考えています。うーん、実際には計算を理解したいです。
AMD Radeon HD 6670 の例: AMD Accelerated Parallel Processing Programming Guide ( http://developer.amd.com/download/AMD_Accelerated_Parallel_Processing_OpenCL_Programming_Guide.pdf ) の 6-42 ページの中ほどで、ストリーム コアの数を取得するように指示されています ( 96)、各ストリーム コアのサイクルあたりの操作数を掛けて (5 になる単精度の ADD を考えてみましょう)、それをコア クロック (800 MHz) で掛けます。その結果、次のようになります。
96 * 5 FLOPS * 800MHz = 384,000 MFLOPS = 384 GFLOPS
まったく同じドキュメントの D-4 ページで、この特定のデバイスのピーク スループットは 768 GFLOPS であることがわかりました。これは、私が計算した値の 2 倍です。ウィキペディアと AMD のホームページには同じことが記載されています。
だから私の質問は次のとおりです。