0

GPU から float 操作の最大数 (フロップ単位) を取得するにはどうすればよいですか?

たとえば、GK20A GPU (Tegra K1 に組み込まれている) では、最大 852 Mhz まで動作し、192 個の cuda コアを備えています (仕様を正しく読めば、それぞれがサイクルごとに 1 つの基本的な fp 操作しか実行できません) 。 852 Mhz までは、基本的には 852 * 192 = 163 GFLOPS でした。

ただし、Nvidia はTegra K1で少なくとも380 GFLOPSを誇っています。何が欠けていますか?

4

0 に答える 0