0

周囲のピクセルのグレー値を使用して、画像の各ピクセルの特徴ベクトルを抽出しようとしています: http://img59.imageshack.us/img59/7398/texturemap.png 黒でマークされたピクセルは、他のピクセルは、後で使用される SVM の結果に対して冗長であるためです。

現時点では、このコードが使用されています:

vector<Histogram*> texture_based(image_file* image) {
  int cat;
  Mat img = cvLoadImage(image->getName().c_str(), CV_LOAD_IMAGE_GRAYSCALE);
  Mat img_b(img.rows + 12, img.cols + 12, img.depth());

copyMakeBorder(img, img_b, 6, 6, 6, 6, IPL_BORDER_CONSTANT, cvScalarAll(0));

vector<Histogram*> result;

for(int i = 6; i < img_b.rows - 6; ++i) {
    for(int j = 6; j < img_b.cols - 6; ++j) {
        Mat hist = Mat::zeros(1, 49, CV_32FC1);
        cat = 0;
        hist.at<float>(0, 0) = (float)img_b.at<char>(i - 6, j - 6);
        hist.at<float>(0, 1) = (float)img_b.at<char>(i - 5, j - 5);
        hist.at<float>(0, 2) = (float)img_b.at<char>(i - 4, j - 4);
        hist.at<float>(0, 3) = (float)img_b.at<char>(i - 3, j - 3);
        hist.at<float>(0, 4) = (float)img_b.at<char>(i - 2, j - 2);
        hist.at<float>(0, 5) = (float)img_b.at<char>(i - 1, j - 1);
        hist.at<float>(0, 6) = (float)img_b.at<char>(i, j);
        hist.at<float>(0, 7) = (float)img_b.at<char>(i + 1, j + 1);
        hist.at<float>(0, 8) = (float)img_b.at<char>(i + 2, j + 2);
        hist.at<float>(0, 9) = (float)img_b.at<char>(i + 3, j + 3);
        hist.at<float>(0, 10) = (float)img_b.at<char>(i + 4, j + 4);
        hist.at<float>(0, 11) = (float)img_b.at<char>(i + 5, j + 5);
        hist.at<float>(0, 12) = (float)img_b.at<char>(i + 6, j + 6);
        hist.at<float>(0, 13) = (float)img_b.at<char>(i + 6, j - 6);
        hist.at<float>(0, 14) = (float)img_b.at<char>(i + 5, j - 5);
        hist.at<float>(0, 15) = (float)img_b.at<char>(i + 4, j - 4);
        hist.at<float>(0, 16) = (float)img_b.at<char>(i + 3, j - 3);
        hist.at<float>(0, 17) = (float)img_b.at<char>(i + 2, j - 2);
        hist.at<float>(0, 18) = (float)img_b.at<char>(i + 1, j - 1);
        hist.at<float>(0, 19) = (float)img_b.at<char>(i - 1, j + 1);
        hist.at<float>(0, 20) = (float)img_b.at<char>(i - 2, j + 2);
        hist.at<float>(0, 21) = (float)img_b.at<char>(i - 3, j + 3);
        hist.at<float>(0, 22) = (float)img_b.at<char>(i - 4, j + 4);
        hist.at<float>(0, 23) = (float)img_b.at<char>(i - 5, j + 5);
        hist.at<float>(0, 24) = (float)img_b.at<char>(i - 6, j + 6);
        hist.at<float>(0, 25) = (float)img_b.at<char>(i, j - 6);
        hist.at<float>(0, 26) = (float)img_b.at<char>(i, j - 5);
        hist.at<float>(0, 27) = (float)img_b.at<char>(i, j - 4);
        hist.at<float>(0, 28) = (float)img_b.at<char>(i, j - 3);
        hist.at<float>(0, 29) = (float)img_b.at<char>(i, j - 2);
        hist.at<float>(0, 30) = (float)img_b.at<char>(i, j - 1);
        hist.at<float>(0, 31) = (float)img_b.at<char>(i, j + 1);
        hist.at<float>(0, 32) = (float)img_b.at<char>(i, j + 2);
        hist.at<float>(0, 33) = (float)img_b.at<char>(i, j + 3);
        hist.at<float>(0, 34) = (float)img_b.at<char>(i, j + 4);
        hist.at<float>(0, 35) = (float)img_b.at<char>(i, j + 5);
        hist.at<float>(0, 36) = (float)img_b.at<char>(i, j + 6);
        hist.at<float>(0, 37) = (float)img_b.at<char>(i - 6, j);
        hist.at<float>(0, 38) = (float)img_b.at<char>(i - 5, j);
        hist.at<float>(0, 39) = (float)img_b.at<char>(i - 4, j);
        hist.at<float>(0, 40) = (float)img_b.at<char>(i - 3, j);
        hist.at<float>(0, 41) = (float)img_b.at<char>(i - 2, j);
        hist.at<float>(0, 42) = (float)img_b.at<char>(i - 1, j);
        hist.at<float>(0, 43) = (float)img_b.at<char>(i + 1, j);
        hist.at<float>(0, 44) = (float)img_b.at<char>(i + 2, j);
        hist.at<float>(0, 45) = (float)img_b.at<char>(i + 3, j);
        hist.at<float>(0, 46) = (float)img_b.at<char>(i + 4, j);
        hist.at<float>(0, 47) = (float)img_b.at<char>(i + 5, j);
        hist.at<float>(0, 48) = (float)img_b.at<char>(i + 6, j);
        if(image->inAnyRec(i, j))
            cat = 1;

        Mat_<float> new_hist = hist;
        Histogram* t = new Histogram(&new_hist, cat);
        result.push_back(t);
    }
}

return result;
}

image_file* は、イメージに関する情報を持つクラスへのポインタです。これを行うより速い方法があるかどうか疑問に思っていました。

4

1 に答える 1

1

4回のパスで操作を計算できます。それぞれが 12 (または 13) 要素のベクトルを初期化し、1 ピクセル東、南、北東、または南東に移動し、ベクトルから 1 ピクセルだけを置き換えます。これには、すべてのヒストグラム ベクトル (幅-12)*(高さ-12)、49 個を一度に初期化する必要もあります。

サポートされているオプションは、元の画像を 4 つの配列に回転/傾斜させることです。その時点で char->float 変換を実行する意味がある場合は、プロファイリングする必要があります。

a b c d   -->  a e i  -->  a f k  >  i f c
e f g h        b f j       b g l     j g d
i j k l        c g k      
               d h l

これらの新しい配列から、メモリ読み取りパターン/キャッシュの局所性が違いを生む可能性があります。

于 2013-04-24T06:48:49.967 に答える