多くの CUDA アクセラレーション機能を備えた Windows で C++ DLL を開発しました。現在、必須ではないため、DllMain 関数を作成していません。
DllMain で呼び出すことができる関数には多くの制限があることを知っています。
デフォルトのコンテキストを初期化するためだけに DllMain で CUDA ランタイム関数を呼び出して、後続の CUDA 呼び出しが高速になることを知りたいだけですか?
開発には Visual Studio 2008、CUDA 5.0、および Windows 8 を使用しています。