0

私は、J.Welles Wilder Jr によって書かれた本に基づいて、パラボリック タイム プライス システムのプログラムを書いています。実行時間は 122 マイクロ秒で、プログラムを実行しています。これは、ベンチマークの限界をはるかに超えています。私が探していたのは、いくつかのビューとヒントです。

  1. 同じことを達成するためにカーネル空間プログラムを書きます。ドライバーによる実装
  2. [この方法に本当に熱心] 可能であれば、どこからどのように探し始め、手順と計算を実行するためにグラフィック ドライバーに指示を渡す必要がありますか (どこかのブログでこれを読んでください)。

前もって感謝します。

--->cでのプログラミング

4

1 に答える 1

2

GPU を非常に高速にしているのは、約 2000 ~ (カードによって異なります) スレッドを非同期で実行できるという事実です。コードをスレッドに分割できる場合、gpgpu で計算を行うとパフォーマンスが向上する可能性があります。これは、正しく使用すると、CPU の平均速度が 50 ~ 100 GFlops、GPU の平均速度が 1500 ~ になるためです。また、gpgpu コードを維持することの難しさを考慮したい場合もあります。NVidia GPU をお持ちの場合は、「Managed CUDA」をチェックアウトすることをお勧めします。これには、デバッガーと、作業を可能にする GPU プロファイラーが含まれているためです。

TL;DR: gpgpu は非同期コードにのみ使用し、可能であれば「マネージド CUDA」を使用することをお勧めします

于 2014-02-04T05:27:20.713 に答える