ピークGFLOPS仕様を提供するデバイスがあり、プログラムがそれからどれだけ離れているかを測定したいと思います。使用したデータはすべて倍精度だったので、操作回数に2を掛けて、GLOPS値を取得し、比較する必要がありますか?
2 に答える
No. 1の倍精度浮動小数点演算は、依然として1つの浮動小数点演算です。
ほとんどのGPUは、単精度よりも倍精度データの処理が遅いため、ピークGFLOPSには2つの仕様が必要です。1つのピーク単精度GFLOPS仕様、および1つのピーク倍精度GFLOPS仕様。場合によっては、さらに分割されて、(たとえば)ピーク分割パフォーマンスがピーク加算パフォーマンスとは別にリストされることがあります。
「 ... 、ops の数を 2 倍して GLOPS 値を取得し、比較する必要がありますか?」
いいえ、これらのカードのいずれか (1 つを除く) ではありません: http://www.geeks3d.com/20140305/amd-radeon-and-nvidia-geforce-fp32-fp64-gflops-table-computing/。
ほとんどの場合、比率は 1/24 から 1/3 までさまざまであることに注意してください。また、「ワークステーション グラフィックス カード」の比率は 1/2 であることに注意してください。DP のパフォーマンスを向上させるために特別に設計されています。
カードのハードウェアの仕様を読み、SP から DP に切り替えることで予想されるパフォーマンス ヒットを判断する必要があります。追加の精度をレジスタ (ハードウェアが操作を実行するメモリ) にロードし、各操作の後に追加の精度を取得するには、少量のオーバーヘッドが追加されます。