問題タブ [cub]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - 終了ビットを指定すると cub::DeviceRadixSort が失敗する
私は、CUB ライブラリの GPU 基数ソート アルゴリズムを使用して、N 個の 32 ビット符号なし整数をソートします。その値はすべて、32 ビットのうち k 個だけを使用し、最下位ビットから開始します。
したがって、並べ替えのパフォーマンスを向上させることを期待して、cub::DeviceRadixSort::SortKeysを呼び出すときにビット サブレンジ [begin_bit, end_bit) を指定します。CUB (1.16.0)の最新リリースを使用しています。
ただし、[begin_bit=0, end_bit=k)、および k = {20,19, 18}、例えば./cub_sort_test 1000000000 0 20
これを、それぞれ CUDA バージョン 11.4 および 11.2 を搭載した Volta および Ampere NVIDIA GPU でテストしました。以前にこれに遭遇した人はいますか、および/または修正を知っていますか? 最小限の再現可能なコード例を次に示します。