1

GPU 上の Cuda で並列プログラムが CPU 上の同様の逐次プログラムよりも高速である場合、逐次プログラムは Compiler Optimizer (gcc -O2) でコンパイルする必要がありますか?

GPUでプログラムを並列化しました。コンパイラ オプティマイザーを使用しない場合の CPU 実装と比較して、18 倍高速化されています。しかし、オプション -O2 を nvcc コンパイラに追加すると、速度アップ率が 8 に低下します。

4

1 に答える 1

1

もちろん、パフォーマンスを比較する場合、オプティマイザーは GPU と CPU プログラムの両方に使用する必要があります。

GPU と CPU に焦点を当てる場合、比較はソフトウェア コードの品質に影響されるべきではありません。多くの場合、コードはそのハードウェアで最高のパフォーマンスを発揮するはずです。

于 2013-07-20T13:27:12.317 に答える