c++ - 複数の画像のリアルタイムSIFT記述子マッチングC++/ OpenCV

Question

同じ子供向けの本から10ページあり、ページの内容はすべて写真であり、トレーニングデータとしてそれぞれからキーポイントと記述子を抽出しました。カメラベースの一致記述子にあるページを検出したい。

これまでに、フレームごとにキーポイントと記述子を抽出し、OpenCVのFlannBasedMatcherを使用してトレーニングデータから記述子を1つずつ照合することで実装し、最も一致するものを返します。

ここでの問題は、リアルタイムで実装できず、トレーニングデータが3ページを超えると実行時間が非常に遅くなることです。

それを実装するためのより良いアプローチを知っている人はいますか？

score 1 · Accepted Answer

実際、Surfははるかに優れたアルゴリズムですが、ふるい分けよりも精度は低くなりますが、実行時間はほぼリアルタイムである必要があります。また、前述のように、特徴を計算し、並列計算を使用してマッチングを行うことをお勧めします（簡単OpenMPを使用しただけなら十分です）。

ただし、サーフで検出されるキーポイントがはるかに少ないことを考慮に入れてください。そのため、オブジェクトが「興味をそそる」または十分な大きさでない場合は、あまり一致しません...

score 1 · Accepted Answer

マッチングはコストのかかるプロセスですが、並列化することができ、処理を高速化するためのいくつかの最適化（ベクトル間のコサインマッチングなど）があります。

より高い精度が必要な場合は、選択肢があまりなく、機能をグループで一致させる必要があります（これには、見つかったトレーニングデータとキーポイントの数に比例した追加の時間が必要です）。

また、SIFTの代わりにSURFを使用することを検討してください。いくつかのスマートな最適化により、はるかに高速です。

2 に答える 2