個々のpthreadで実行したいCUDAカーネルがいくつかあります。
基本的に、各pthread、たとえば3つのcudaカーネルを実行する必要があり、それらは順番に実行する必要があります。
各pthreadにストリームへの参照を渡そうと思ったので、これら3つのcudaカーネルはすべて、同じストリームで順番に実行されます。
これをpthreadの別のコンテキストで機能させることができます。これにより、カーネルが通常どおり実行されますが、これには多くのオーバーヘッドがかかるようです。
では、他のpthreadと同時に、各pthreadを同じコンテキストで動作させるにはどうすればよいですか?
ありがとう