2

TBB(スレッドビルディングブロック)を使用して実行したときに使用したものと同じコード(一種)を使用しようとしています。

OpenCL の経験はあまりありませんが、メイン コードのほとんどは正しいと思います。エラーは.cl、計算を行うファイルにあると思います。

TBB の私のマンデルブロー コードは次のとおりです。

マンデルブロ TBB

これがOpenCLの私のコードです

マンデルブロ OpenCL

どんな助けでも大歓迎です。

4

2 に答える 2

2

カーネルのコードを変更したところ、問題なく動作しました。私の新しいカーネルコードは次のとおりです。

// voronoi kernels

//
// local memory version
//
kernel void voronoiL(write_only image2d_t outputImage)
{
    // get id of element in array
    int x = get_global_id(0);
    int y = get_global_id(1);
    int w = get_global_size(0);
    int h = get_global_size(1);

    float4 result = (float4)(0.0f,0.0f,0.0f,1.0f);
    float MinRe = -2.0f;
    float MaxRe = 1.0f;
    float MinIm = -1.5f;
    float MaxIm = MinIm+(MaxRe-MinRe)*h/w;
    float Re_factor = (MaxRe-MinRe)/(w-1);
    float Im_factor = (MaxIm-MinIm)/(h-1);
    float MaxIterations = 50;


    //C imaginary
    float c_im = MaxIm - y*Im_factor;

    //C real
    float c_re = MinRe + x*Re_factor;

    //Z real
    float Z_re = c_re, Z_im = c_im;

    bool isInside = true;
    bool col2 = false;
    bool col3 = false;
    int iteration =0;

    for(int n=0; n<MaxIterations; n++)
    {
        // Z - real and imaginary
        float Z_re2 = Z_re*Z_re, Z_im2 = Z_im*Z_im;

        //if Z real squared plus Z imaginary squared is greater than c squared
        if(Z_re2 + Z_im2 > 4)
        {
            if(n >= 0 && n <= (MaxIterations/2-1))
            {
                col2 = true;
                isInside = false;
                break;
            }
            else if(n >= MaxIterations/2 && n <= MaxIterations-1)
            {
                col3 = true;
                isInside = false;
                break;
            }
        }
        Z_im = 2*Z_re*Z_im + c_im;
        Z_re = Z_re2 - Z_im2 + c_re;
        iteration++;
    }
    if(col2) 
    { 
        result = (float4)(iteration*0.05f,0.0f, 0.0f, 1.0f);
    }
    else if(col3)
    {
        result = (float4)(255, iteration*0.05f, iteration*0.05f, 1.0f);
    }
    else if(isInside)
    {
        result = (float4)(0.0f, 0.0f, 0.0f, 1.0f);
    }


    write_imagef(outputImage, (int2)(x, y), result);
}

ここでも見つけることができます:

https://docs.google.com/file/d/0B6DBARvnB__iUjNSTWJubFhUSDA/edit

于 2013-04-20T00:48:28.923 に答える
1

このリンクを参照してください。@eric-bainville によって開発されました。ネイティブと OpenCL の両方の CPU コードは最適ではありません (SSE/AVX を使用していません) が、GPU コードは良いと思います。CPU の場合、AVX を使用して一度に 8 ピクセルを操作することで、コードをかなり高速化できます。

http://www.bealto.com/mp-mandelbrot.html

于 2013-04-15T07:52:30.583 に答える