複数の cuda ストリームを使用して、カーネルの同時実行を提供するかどうかを知りたいですか? それとも、コピーとカーネル実行の並行性のみを提供しますか? 実際、複数の同時カーネルを実行するソリューションを探しています。誰でも私を助けることができますか?
複数の cuda ストリームを使用して、カーネルの同時実行を提供するかどうかを知りたいですか? それとも、コピーとカーネル実行の並行性のみを提供しますか? 実際、複数の同時カーネルを実行するソリューションを探しています。誰でも私を助けることができますか?