1

サイズが 96 x 96 の線形システムを解く共役勾配アルゴリズムを実行しています。同じコード、同じ反復回数、同じ精度 (倍精度) を使用すると、Geforce 480 でかかる時間は約 33.6 ミリ秒ですが、 Tesla C2070 では約 132.1 ms で、Geforce 480 と比較してほぼ 4 倍です。

これはあなたには普通に見えますか?誰かが同様の結果を経験していますか、それとも私は何か間違ったことをしましたか?

どうもありがとう!

4

1 に答える 1

0

共役勾配を探しているときにこの投稿に出くわしました。

この行列サイズ (96x96) の場合、共役勾配は過剰です。コレスキー分解を使用すると、はるかに高速になるはずです。同様に、GPU の使用は、それらの束を並行して解決する場合を除いて、役に立たないようです。

パフォーマンスの違いについては、さまざまな説明があるかもしれませんが、システムのサイズが原因で、CG アルゴリズムの反復部分がおそらく制限されていることをお勧めします。Geforce は、レイテンシと CPU との通信で優れている可能性があります。

于 2014-11-16T19:25:50.633 に答える