5

CUDAを使用してGPUでデータ並列アルゴリズムを使用するために、2つの標準ライブラリ、CUDPPとThrustがあり、ソート、リダクション、プレフィックス合計などを実装します。

では、パフォーマンスと機能の点で、ライブラリ間の主な違いは何ですか?

4

1 に答える 1

3

約 1 年前に並べ替えとプレフィックスの合計の両方を使用しました (CUDA 4.1 を使用しましたが、Thrust と CUDPP のバージョンを思い出せません)。CUDPP の方が少し高速ですが、Thrust の方が使いやすい (float を使用) -約 20M エントリの配列)。

機能に関しては、私が思い出す限り、(CUDPP とは対照的に) デバイス メモリだけでなく、ホスト メモリでも Thrust を使用できますが、これは時代遅れかもしれません。

于 2012-07-20T08:02:52.070 に答える