1

同じ子供向けの本から10ページあり、ページの内容はすべて写真であり、トレーニングデータとしてそれぞれからキーポイントと記述子を抽出しました。カメラベースの一致記述子にあるページを検出したい。

これまでに、フレームごとにキーポイントと記述子を抽出し、OpenCVのFlannBasedMatcherを使用してトレーニングデータから記述子を1つずつ照合することで実装し、最も一致するものを返します。

ここでの問題は、リアルタイムで実装できず、トレーニングデータが3ページを超えると実行時間が非常に遅くなることです。

それを実装するためのより良いアプローチを知っている人はいますか?

4

2 に答える 2

1

実際、Surfははるかに優れたアルゴリズムですが、ふるい分けよりも精度は低くなりますが、実行時間はほぼリアルタイムである必要があります。また、前述のように、特徴を計算し、並列計算を使用してマッチングを行うことをお勧めします(簡単OpenMPを使用しただけなら十分です)。

ただし、サーフで検出されるキーポイントがはるかに少ないことを考慮に入れてください。そのため、オブジェクトが「興味をそそる」または十分な大きさでない場合は、あまり一致しません...

于 2013-03-14T18:40:01.483 に答える
1

マッチングはコストのかかるプロセスですが、並列化することができ、処理を高速化するためのいくつかの最適化(ベクトル間のコサインマッチングなど)があります。

より高い精度が必要な場合は、選択肢があまりなく、機能をグループで一致させる必要があります(これには、見つかったトレーニングデータとキーポイントの数に比例した追加の時間が必要です)。

また、SIFTの代わりにSURFを使用することを検討してください。いくつかのスマートな最適化により、はるかに高速です。

于 2013-03-14T18:11:57.957 に答える