Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
CUDAを使用してGPUでデータ並列アルゴリズムを使用するために、2つの標準ライブラリ、CUDPPとThrustがあり、ソート、リダクション、プレフィックス合計などを実装します。
では、パフォーマンスと機能の点で、ライブラリ間の主な違いは何ですか?
約 1 年前に並べ替えとプレフィックスの合計の両方を使用しました (CUDA 4.1 を使用しましたが、Thrust と CUDPP のバージョンを思い出せません)。CUDPP の方が少し高速ですが、Thrust の方が使いやすい (float を使用) -約 20M エントリの配列)。
機能に関しては、私が思い出す限り、(CUDPP とは対照的に) デバイス メモリだけでなく、ホスト メモリでも Thrust を使用できますが、これは時代遅れかもしれません。