0

こんにちは、私は現在、CUDA 計算を含む Mex ファイルを matlab で開発しています。ユーザーからの任意の入力パラメーターに対してプログラムを「自動的に」最適化する良い方法があるかどうか疑問に思います。たとえば、入力パラメータが特定のサイズを超えない場合は、共有および/または定数メモリを使用してみてください...これは特定の制限までしか機能しません。それ以降は、グローバル メモリを使用する必要があります。しかし、そのような最適化は実行時にのみ行うことができます。これは、ユーザーからの入力パラメーターのサイズを知るポイントであるためです。簡単な解決策はありますか?ありがとう!

4

1 に答える 1

2

単純に異なるカーネルを作成し、実行時に呼び出すカーネルを決定できます。

また、デバイス クエリ API を使用するか、マイクロ ベンチマークを実行して、実行時の共有/定数メモリのサイズを把握することもできます。これは、特定の GPU モデルを想定したくない場合に必要になる可能性があります。

于 2011-05-12T17:06:35.603 に答える