1

cublas と atlas の両方からの dgemm の私の測定によると、atlas は速度の点で cublas を大幅に上回っています。これは、Intel i7 950 と Nvidia GTX470 を搭載したシステムで予期されることですか?

サイズ 10x10 から 6000x6000 までの行列を 50 刻みでテストしました。Atlas は常に勝ちます。アプリケーションの実行全体と乗算ステップのみを測定します。

他の誰かがこれを経験していますか?これは期待される結果ですか?

前もって感謝します。

編集: (同じコード、Xeon X5670 と Nvidia Tesla C2050 で同じ結果)

edit2: cublas ライブラリの初期化が原因であるとすれば、かなりの遅さのようです。私はそれに取り組み続けています。詳細がわかり次第、ここで更新します。

4

1 に答える 1