1

フーリエ振幅スペクトルを画像に変換しようとすると、スケーリングの問題が発生していると思います。

カメラ入力からの連続するフレーム間の移動と回転を決定するために、独自のビジュアル オドメトリ プロジェクトに取り組んでいます。フーリエ変換の位相相関を使用して並進を決定することに成功しましたが、回転を決定する一部では、マグニチュード スペクトルを畳み込む必要があります。基本的に、以下のように、私が作成した等級は正しくないようです。

元の画像:
ここに画像の説明を入力

「mag = 255*(mag/max)」スケーリングによるマグニチュード
ここに画像の説明を入力

スケーリングなしのマグニチュード
ここに画像の説明を入力

残念ながら、マグニチュードを決定するために使用している関数に関して助けが必要です。私のエラーはマグニチュードのスケーリングにあると思いますが、正確にはわかりません. この問題はしばらくの間私を悩ませていました。ご意見をお寄せください。ありがとうございます。

void iplimage_dft(IplImage* img)
{
  IplImage*     img1, * img2;
  fftw_complex* in, * dft, * idft;
  fftw_plan     plan_f, plan_b;
  int           i, j, k, w, h, N;

  /* Copy input image */
  img1 = cvCloneImage(img);

  w = img1->width;
  h = img1->height;
  N = w * h;

  /* Allocate input data for FFTW */
  in   = (fftw_complex*) fftw_malloc(sizeof(fftw_complex) * N);
  dft  = (fftw_complex*) fftw_malloc(sizeof(fftw_complex) * N);

  /* Create plans */
  plan_f = fftw_plan_dft_2d(w, h, in, dft, FFTW_FORWARD, FFTW_ESTIMATE);

  /* Populate input data in row-major order */
    for (i = 0, k = 0; i < h; i++) 
    {
        for (j = 0; j < w; j++, k++)
        {
            in[k][0] = ((uchar*)(img1->imageData + i * img1->widthStep))[j];
           in[k][1] = 0.0;
        }
    }

  /* Forward & inverse DFT */
  fftw_execute(plan_f);

  /* Create output image */
  img2 = cvCreateImage(cvSize(w, h), 8, 1);

    //Find the maximum value among the magnitudes
    double max=0;
    double mag=0;
    for (i = 0, k = 1; i < h; i++){
        for (j = 0; j < w; j++, k++){
            mag = sqrt(pow(dft[k][0],2) + pow(dft[k][1],2));
            if (max < mag)
                max = mag;
        }
    }

  // Convert DFT result to output image
    for (i = 0, k = 0; i < h; i++)
    {
        for (j = 0; j < w; j++, k++)
        {
            double mag = sqrt(pow(dft[k][0],2) + pow(dft[k][1],2));
            mag = 255*(mag/max);
            ((uchar*)(img2->imageData + i * img2->widthStep))[j] = mag;
        }
    }   

  cvShowImage("iplimage_dft(): original", img1);
  cvShowImage("iplimage_dft(): result", img2);
  //cvSaveImage("iplimage_dft.png", img2,0 );
  cvWaitKey(0);

  /* Free memory */
  fftw_destroy_plan(plan_f);
  fftw_free(in);
  fftw_free(dft);
  cvReleaseImage(&img1);
  cvReleaseImage(&img2);
}

int main( int argc, char** argv )
{
    argv[1] = "image1.jpg";

    IplImage *img3 = cvLoadImage( argv[1], CV_LOAD_IMAGE_GRAYSCALE );
    iplimage_dft(img3);
    return 0;
}
4

1 に答える 1

0

多くの画像のスペクトルには、このような特性があります。いくつかの比較的高いピークがあり、残りのフィールドの大きさは非常に小さくなっています。正しく正規化しているように見えますが、スペクトルの大部分の大きさが非常に小さいため、詳細が失われているだけです。詳細を調べたい場合は、log(mag(spectrum))(場合によってはlog(log(mag(spectrum))))を使用して画像を生成する方が便利なことがよくあります。

于 2012-08-15T14:28:33.470 に答える