CUBLAS にはデータの種類ごとに個別の関数がありますが、テンプレート内から CUBLAS を呼び出したいです。
template <typename T> foo(...) {
...
cublas<S/D/C/Z>geam(..., const T* A, ...);
...
}
正しい関数呼び出しをトリガーするにはどうすればよいですか?
同じ関数名で異なるタイプの cublas ラッパー関数を作成しました。
inline cublasStatus_t cublasGgeam(cublasHandle_t handle,
cublasOperation_t transa, cublasOperation_t transb,
int m, int n,
const float *alpha,
const float *A, int lda,
const float *beta,
const float *B, int ldb,
float *C, int ldc)
{
return cublasSgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
}
inline cublasStatus_t cublasGgeam(cublasHandle_t handle,
cublasOperation_t transa, cublasOperation_t transb,
int m, int n,
const double *alpha,
const double *A, int lda,
const double *beta,
const double *B, int ldb,
double *C, int ldc)
{
return cublasDgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
}
その後、同じ関数名を持つ任意の型に対してgeam()を呼び出すことができます。C++ コンパイラは、パラメーターの型によって適切な関数を選択します。あなたの場合、それは次のようになるはずです
template <typename T> foo(...) {
...
cublasGgeam(..., A, ...);
...
}
これは完了時のオーバーロードであり、ランタイム コストはまったくありませんが、ラッパー関数の長いリストを作成する必要があります。