2

多くのアプリケーションで、特にグラフィックス ハードウェアが十分に活用されている場合、GPU はマルチコア CPU よりもエネルギー効率が高いという意見を聞いたことがあります。その主張につながる特定のアーキテクチャ機能を説明する論文、記事、または何か、または一連のベンチマークで GPU のエネルギー消費を CPU と直接比較する科学的研究を見つけるのに苦労しています。誰かがこの主張の裏づけについてより多くの洞察を提供してくれますか、またはその証拠を示すいくつかの研究を私に指摘してくれますか?

推測する必要がある場合、それは主に GPU クロックの周波数が低いことに起因すると言えます。さらに、この論文は次のとおりです。

http://accel.cs.vt.edu/sites/default/files/paper/huang-hppac09-gpu.pdf

これは、GPU が問題をより迅速に解決した結果であることが部分的に示唆されているため、GPU のピーク消費電力は高くても、GPU がそのレベルで費やす時間は CPU よりもはるかに短くなります (適切な問題の場合)。誰でも追加できますか?

ありがとう!

4

2 に答える 2

4

TL;DR の回答: gpu 内のトランジスタの多くは、実際には cpu 内よりも計算に取り組んでいます。

今日の CPU の大きな電力効率のキラーは、チップ上で一般的な計算を可能にするためのトレードオフです。RISC、x86、またはその他の CPU アーキテクチャのいずれであっても、CPU の汎用使用専用の追加のハードウェアがあります。これらのトランジスタは電気を必要としますが、実際の計算は行っていません。

高速な CPU には、高度な分岐予測ハードウェアと大容量のキャッシュ メモリが必要であり、後でパイプラインで破棄される可能性のある長い処理を回避できます。ほとんどの場合、CPU は一度に 1 つずつ命令を実行し (CPU コアごとに、SIMD は CPU にも役立ちます...)、条件を非常にうまく処理します。GPU は、多数のデータに対して同じ操作 (SIMD/ベクトル操作) を実行することに依存しており、「if」および「for」ステートメントに見られる単純な条件に大きな影響を受けます。

命令のフェッチ、デコード、およびスケジュールに使用されるハードウェアも多数あります。これは cpus と gpus にも当てはまります。この大きな違いは、フェッチ + デコード + スケジュール トランジスタとコンピューティング トランジスタの比率が、GPU でははるかに高くなる傾向があることです。

これは、時間の経過とともに gpu がどのように変化したかについての AMD プレゼンテーション (2011) ですが、これは一般的にほとんどの gpu に実際に当てはまります。PDFリンク。gpu がどのようにして特定の計算で優れた性能を発揮するようになったのか、背景にある歴史を少し知ることで、gpu のパワーの利点を理解するのに役立ちました。

少し前に同様の質問に答えました。そうリンク。

于 2013-01-29T17:09:41.620 に答える
0

通常、これらの主張は、この投稿に示されているように、GFLOP のパフォーマンスを比較し、浮動小数点演算ごとの電力を見積もることによって裏付けられています。しかし、これは本質的にあなたが最後の文で書いたことです。

また、CPU と GPU のアーキテクチャが異なる問題を対象としていることも考慮する必要があります。CPU コア (少なくとも x86 では) は深いパイプライン、大規模な命令セット、およびさまざまな問題に対応するための非常に洗練されたキャッシュ戦略を備えていますが、GPU コアはかなり単純であるため、消費電力がはるかに少なくなります。これを補うために、GPU には CPU よりも多くのコンピューティング コアがあります。しかし、あなたはおそらくそれをすでに知っています。

于 2013-01-29T16:20:57.233 に答える