私は現在、一連の pthreads (linux) を生成するアプリケーションを使用しており、それらのそれぞれが独自の CUDA コンテキストを作成します。(現在cuda 3.2を使用しています)。
私が抱えている問題は、独自のコンテキストを持つ各スレッドが GPU で大量のメモリを消費するように見えることです。スレッドあたり 200MB のようなものなので、これは本当に私を制限しています。
ホストスレッドでストリームを作成し、ストリーム参照をワーカースレッドに渡すだけで、CUDA ライブラリにストリーム番号を渡すことができ、すべてが同じコンテキストで機能しますか?
ワーカー スレッドは、親スレッドと同じ CUDA コンテキストを自動的に認識しますか?
ありがとう