問題タブ [cub]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
27 参照

cuda - 終了ビットを指定すると cub::DeviceRadixSort が失敗する

私は、CUB ライブラリの GPU 基数ソート アルゴリズムを使用して、N 個の 32 ビット符号なし整数をソートします。その値はすべて、32 ビットのうち k 個だけを使用し、最下位ビットから開始します。

したがって、並べ替えのパフォーマンスを向上させることを期待して、cub::DeviceRadixSort::SortKeysを呼び出すときにビット サブレンジ [begin_bit, end_bit) を指定します。CUB (1.16.0)の最新リリースを使用しています。

ただし、[begin_bit=0, end_bit=k)、および k = {20,19, 18}、例えば./cub_sort_test 1000000000 0 20

これを、それぞれ CUDA バージョン 11.4 および 11.2 を搭載した Volta および Ampere NVIDIA GPU でテストしました。以前にこれに遭遇した人はいますか、および/または修正を知っていますか? 最小限の再現可能なコード例を次に示します。