数値計算環境の Matlab (または無料の代替 GNU Octave など) は、conv2 と呼ばれる関数を提供し、畳み込みカーネルを使用して特定の行列の 2 次元畳み込みを行います。無料の画像処理ライブラリ OpenCV に基づいていくつかの C++ コードを書いているときに、OpenCV が現在同等の方法を提供していないことがわかりました。
2 次元相関を実装し、特定のカーネルで画像を畳み込むために使用できる filter2D() メソッドがありますが (対応する OpenCV ドキュメント ページで説明されているように、そのカーネルを反転し、アンカー ポイントを正しい位置に移動することによって) )、たとえば、OpenCV を使用して Matlab と C++ の両方で実装された同じアルゴリズムの結果を比較するために、Matlab と同じ境界処理オプション (「完全」、「有効」、または「同じ」畳み込み) を提供するメソッドがあると便利です。
これが私が思いついたものです:
enum ConvolutionType {
/* Return the full convolution, including border */
CONVOLUTION_FULL,
/* Return only the part that corresponds to the original image */
CONVOLUTION_SAME,
/* Return only the submatrix containing elements that were not influenced by the border
*/
CONVOLUTION_VALID
};
void conv2(const Mat &img, const Mat& kernel, ConvolutionType type, Mat& dest) {
Mat source = img;
if(CONVOLUTION_FULL == type) {
source = Mat();
const int additionalRows = kernel.rows-1, additionalCols = kernel.cols-1;
copyMakeBorder(img, source, (additionalRows+1)/2, additionalRows/2,
(additionalCols+1)/2, additionalCols/2, BORDER_CONSTANT, Scalar(0));
}
Point anchor(kernel.cols - kernel.cols/2 - 1, kernel.rows - kernel.rows/2 - 1);
int borderMode = BORDER_CONSTANT;
filter2D(source, dest, img.depth(), flip(kernel), anchor, 0, borderMode);
if(CONVOLUTION_VALID == type) {
dest = dest.colRange((kernel.cols-1)/2, dest.cols - kernel.cols/2)
.rowRange((kernel.rows-1)/2, dest.rows - kernel.rows/2);
}
}
私の単体テストでは、この実装は、Matlab の実装とほぼ同じ結果をもたらしました。カーネルが十分に大きい場合、OpenCV と Matlab の両方がフーリエ空間で畳み込みを行うことに注意してください。「大規模」の定義は両方の実装で異なりますが、大規模なカーネルの場合でも、結果は非常に似ているはずです。
また、ソース行列全体をコピーして周囲に境界線を追加する必要があるため、この方法のパフォーマンスは「フル」畳み込みの場合に問題になる可能性があります。最後に、filter2D() 呼び出しで例外を受け取り、1 つの列しか持たないカーネルを使用している場合は、このバグが原因である可能性があります。その場合は、代わりに borderMode 変数を BORDER_REPLICATE などに設定するか、OpenCV トランクからライブラリの最新バージョンを使用します。