カーネルを終了せずに、共有メモリ内の配列を並列にソートしたい。
Thrust for CUDA を使用して、グローバル メモリ内の配列を並べ替えることができます。しかし、それはホストでのみ行うことができます。そのためにはカーネルを終了する必要があります。しかし、別のカーネルを再起動すると、スレッド内のすべてのローカル メモリが失われ、ローカル メモリを補充する必要があります。
これにライブラリはありますか?それとも、とにかくカーネルを渡してホストに来て、スラストを使用してデバイス内の配列をソートしてからカーネルを再開しますか?