私はCUDAでこのようなsomtehingを作ろうとしていました(実際にはいくつかの統合関数を書く必要があります)
#include <iostream>
using namespace std;
float f1(float x) {
    return x * x;
}
float f2(float x) {
    return x;
}
void tabulate(float p_f(float)) {
    for (int i = 0; i != 10; ++i) {
        std::cout << p_f(i) << ' ';
    }
    std::cout << std::endl;
}
int main() {
    tabulate(f1);
    tabulate(f2);
    return 0;
}
出力:
0 1 4 9 16 25 36 49 64 81
0 1 2 3 4 5 6 7 8 9
次のことを試しましたが、エラーが発生しました
エラー:関数ポインターと関数テンプレートパラメーターはsm_1xではサポートされていません。
float f1(float x) {
    return x;
}
__global__ void tabulate(float lower, float upper, float p_function(float), float* result) {
    for (lower; lower < upper; lower++) {
        *result = *result + p_function(lower);
    }
}
int main() {
    float res;
    float* dev_res;
    cudaMalloc( (void**)&dev_res, sizeof(float) ) ;
    tabulate<<<1,1>>>(0.0, 5.0, f1, dev_res);
    cudaMemcpy(&res, dev_res, sizeof(float), cudaMemcpyDeviceToHost);
    printf("%f\n", res);
    /************************************************************************/
    scanf("%s");
    return 0;
}