0

ハフ変換を使用してバイナリ イメージ内の円を検出しようとしています。ここに私の問題を投稿してくださいハフ変換:OpenCLでのアルゴリズム効率の向上

実行時のカーネルコードは非常に遅いです。アトミック関数の待機時間と私はローカルメモリを使用しようとしていますが、カーネルコードの[]出力アキュムレータの問題は高速です

   kernel void hough_circle(read_only image2d_t imageIn, global int* in,const int w_hough,__global int * circle)
  {
         sampler_t sampler=CLK_NORMALIZED_COORDS_FALSE | CLK_ADDRESS_CLAMP_TO_EDGE | CLK_FILTER_NEAREST;
     int gid0 = get_global_id(0);
     int gid1 = get_global_id(1);
         const int nWidth = get_local_size(0);

int i = get_group_id(0);
int j = get_group_id(1); 
int idX = get_local_id(0);
int idY = get_local_id(1);
    int ii = i*nWidth + idX; 
int jj = j*nWidth + idY; 
     uint4 pixel;
     int x0=0,y0=0,r;
     int maxval=0;
        local int localImage[25];
        localImage[idY*5+idX] = 0;   
        barrier(CLK_LOCAL_MEM_FENCE);
     pixel=read_imageui(imageIn,sampler,(int2)(gid0,gid1));
     if(pixel.x==255)
     {
    //  #pragma unroll 20
        for(int r=90;r<110;r+=1)
     {
         // int r=190;

            //    #pragma unroll 360
               for(int theta=0; theta<360;theta++)
              {

                          //     x0=(int) round(gid0-r*cos( (float) radians( (float) theta) ));
                          //    y0=(int) round(gid1-r*sin( (float) radians( (float) theta) ));

                              x0=(int) round(gid0-r*sin_parameter[theta] );
                            y0=(int) round(gid1-r*cos_parameter[theta] );
                                  if((x0>0) && (x0<get_global_size(0)) && (y0>0)&&(y0<get_global_size(1)))
                             //  in[w_hough*y0+x0]++;
                                   localImage[5*y0+x0]++;
                            //  atom_inc(&in[w_hough*y0+x0]);
               }
              }

     }


 in[jj*w_hough+ii]=  localImage[jj*5+ii];

  }  

ローカル 出力アキュムレータの問題 in[] 不正な値をランダムに表示 問題を解決するために私が行った変更を誰か助けてくれませんか

4

1 に答える 1

0

ローカル メモリはワークグループ全体で共有されるため、最初の質問は、スレッドをどのようにワークグループに分割しているのかということだと思います。

でデフォルト値を使用しているだけの場合、clEnqueueNDRangeKernelどのスレッドがローカル メモリにアクセスできるかを OpenCL に決定させることになり、一見奇妙なことが起こります。

おそらく、private代わりにメモリを使用するつもりでしたか?その場合は、localImage の宣言の前に local を削除します。ローカル メモリは、グローバルと同様に宣言されます。

__kernel void function(__global float *Input, __local float *WorkgroupBuffer){ }

于 2013-11-07T20:37:25.613 に答える