1

画像内のパターンを検索するためのソフトウェアを実装しました。cvMatchTemplate を使用すると、実行時間は約 10 ミリ秒です (120x160 ピクセルの検索ウィンドウで 40x40 のパターンを取得しているためです。画像は 640x480 であるため、画像全体を考慮していません)。

gpu::MatchTemplate を使用して同じアルゴリズムを実装しましたが、実行時間の改善を期待していました。スコアの計算には 220 ミリ秒かかります。

何が起こっている?

ありがとう。

編集: 画像の読み込み時間を測定したところ、画像が既に圧縮されていないため、「.upload」機能の実行に 1 ミリ秒かかりました。

同じアルゴリズムじゃない?

編集: CUDA と独自のカーネルを使用してコードを記述しました。画像に対して cuda 関数を使用して FFT を実行し、アルゴリズムの実行全体は、1024x1024 画像と 200x200 のパターンで 2 ミリ秒未満です。exec を測定するために、thread_sync を使用しました。時間。

4

1 に答える 1

0

GPU の処理能力に大きく依存していると思います。一部の GPU は CPU よりも優れたパフォーマンスを発揮できません。この質問を見るgpuvscpu

于 2014-10-20T15:58:53.190 に答える