プロファイリングの結果を見ると、thrust::min_element()
呼び出しcudaMalloc()
が追加のメモリを使用していることがわかります。縮小後は配列データは必要ないので、最小限の要素をインプレースで見つけたいと思います。出来ますか?
質問する
266 次
1 に答える
1
Thrust のリダクションはO(1)
一時ストレージのみを使用します (実際にO(#processors))
は、割り当てを自分で管理することを主張する場合は、独自のカスタム割り当てスキームを実装できます。
于 2012-04-11T18:32:48.130 に答える