NVIDIA CUDA の CUBLAS ライブラリを使用すると、絶対値が最大の要素/インデックスを見つけることができます (cublasIsamax)。CUBLASリダクション関数を使用して、実際の最大値を持つ要素/インデックスを見つけることは可能ですか?
【CUBLAS バージョン 3.2 を使用しています。】
制約の編集
: 本番サーバーの状態を変更することはできません。これは、thrust/cudpp を使用できず、古いバージョンの CUBLAS を使用したままになっていることを意味します。