CPU 最適化 BLAS ライブラリを使用した行列計算を行う既存の MFC アプリケーションがあります。自分のプロジェクトに CuBLAS 計算機能を追加することに興味がありますが、次の 2 つの質問があります。
1) この時点で、独自の CUDA カーネル、スレッド、およびブロック構成を指定するために何かをする必要があるかどうかはわかりません。もしそうなら、アルゴリズムを変更する際に、アーキテクチャのどのセクションに最も注意を払うことをお勧めしますか?
2) (a) プログラム内の CuBLAS 機能を使用して Visual Studio で新しいプロジェクトを作成するか、(b) CuBLAS 機能を既存の MFC プロジェクトに統合することに関心があります。ただし、Visual Studio プロジェクトを CUDA SDK で適切に動作するように構成するには、このようなガイドに従う以外に問題があります。これを既存のプロジェクトと統合しようとすると、うまくいかない可能性があります。これに関するあなたの推奨事項は何ですか?
コメントありがとうございます。