4

文字列を GPU に渡し、GPU から取得して印刷したいと考えています。それは目的を理解するためのものです - 私は知っています、その考えは無意味に聞こえます.

私は試した:

OpenCL:

__kernel void same_in_same_out_char(__global uchar * out, __constant uchar * in){
  for (unsigned int ui=0; ui<3; ui++) out[ui]=in[ui];
}

C++:

#define __CL_ENABLE_EXCEPTIONS

#include <fstream>
#include <iostream>
#include <iterator>
#include <CL/cl.hpp>
#include <CL/opencl.h>


using namespace std;
int main () {

    vector<cl::Platform> platforms;
    vector<cl::Device> devices;
    vector<cl::Kernel> kernels;
    
    try {
    
        // create platform
        cl::Platform::get(&platforms);
        platforms[0].getDevices(CL_DEVICE_TYPE_GPU, &devices);

        // create context
        cl::Context context(devices);

        // create command queue
        cl::CommandQueue queue(context, devices[0]);

        // load opencl source
        ifstream cl_file("inout.cl");
        string cl_string(istreambuf_iterator<char>(cl_file), (istreambuf_iterator<char>()));
        cl::Program::Sources source(1, make_pair(cl_string.c_str(), 
            cl_string.length() + 1));

        // create program
        cl::Program program(context, source);

        // compile opencl source
        program.build(devices);

        // load named kernel from opencl source
        cl::Kernel kernel(program, "same_in_same_out_char");

        // create a message to send to kernel 
        const char pwd[] = "MAX";
        cout << "char pwd[] : " << pwd << endl;
        cl_uchar * password = (cl_uchar*) &pwd;
        int bufferA_size = 3; // array size is 3

        int bufferC_size = 3; // array size is 3
        cout << " -- OpenCL -- " << endl;

        // allocate device buffer to hold message
        cl::Buffer bufferA(context, CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR, sizeof(cl_uchar) * bufferA_size, password);
        cl::Buffer bufferC(context, CL_MEM_WRITE_ONLY, sizeof(cl_uchar) * bufferC_size);

        // set message as kernel argument
        kernel.setArg(0, bufferC);
        kernel.setArg(1, bufferA);

         // execute kernel
        queue.enqueueTask(kernel);

        // wait for completion
        queue.finish();
        // ----------------------

        cl_uint out_global[bufferC_size];
    queue.enqueueReadBuffer(bufferC, CL_TRUE, 0, bufferC_size*sizeof(cl_uchar), &out_global);

        cout << "Output \t\t:" << *out_global << endl << "Output[1..n] \t:";
        for (unsigned int i=0; i<bufferC_size; i ++) cout << out_global[i] << " " ;

        cout << endl;
    } catch (cl::Error e) {
        cout << endl << e.what() << " : " << e.err() << endl;
    }
    
    return 0;
    
}

しかし、私は失敗しました。出力は

出力:5783885

出力[1..n]:5783885 0 26

だがしかし

MAX または 77 65 88

(MAX用)。

よろしく、マーカス

4

1 に答える 1

7

実際には期待どおりの答えが得られますが、間違ったデータ型に入れています。

取得しているのは単一の整数5783885で、これは0x0058414D(16 進数で) リトルエンディアン プラットフォームを使用しているため、これらのバイトはメモリ内で下位から上位に配置されます。つまり、メモリを見ると、バイトは次のようになります (まだ 16 進数):

4D, 41, 58, 00, ...

これらは、10 進数で表示されます。

77, 65, 88, 0, ...

言い換えれば、まさにあなたが期待するものです。

あなたの問題 (少なくとも問題の 1 つ) は、またはまたは何かの代わりに、s のout_global配列として宣言したことです。cl_uintcl_ucharcl_char

したがって、次の行を変更すると、おそらく問題ありません。

cl_uint out_global[bufferC_size];
于 2013-07-07T20:54:57.877 に答える