画像内のパターンを検索するためのソフトウェアを実装しました。cvMatchTemplate を使用すると、実行時間は約 10 ミリ秒です (120x160 ピクセルの検索ウィンドウで 40x40 のパターンを取得しているためです。画像は 640x480 であるため、画像全体を考慮していません)。
gpu::MatchTemplate を使用して同じアルゴリズムを実装しましたが、実行時間の改善を期待していました。スコアの計算には 220 ミリ秒かかります。
何が起こっている?
ありがとう。
編集: 画像の読み込み時間を測定したところ、画像が既に圧縮されていないため、「.upload」機能の実行に 1 ミリ秒かかりました。
同じアルゴリズムじゃない?
編集: CUDA と独自のカーネルを使用してコードを記述しました。画像に対して cuda 関数を使用して FFT を実行し、アルゴリズムの実行全体は、1024x1024 画像と 200x200 のパターンで 2 ミリ秒未満です。exec を測定するために、thread_sync を使用しました。時間。