私はCVにかなり慣れていないので、愚かな質問を許してください...
やりたいこと:
ライブ ビデオで RC 飛行機を認識したい (今のところ、記録されたビデオのみ)。
私がこれまでに行ったこと:
- フレームの違い
- グレースケールに変換する
- ガウスぼかし
- しきい値
- 輪郭を見つける
フレームの例を次に示します。
ただし、ノイズのあるフレームもあるため、フレーム内にはより多くのオブジェクトがあります。
私はこのようなことができると思いました:
見つかったすべての輪郭に対して何らかのオブジェクト認識アルゴリズムを使用します。そして、これらの境界矩形のそれぞれについて特徴ベクトルのみを計算します。
画像の特定のパッチ (小さい部分) に対してのみ SURF/SIFT/... を計算することは可能ですか?
アルゴリズムがリアルタイムのビデオを処理できることが重要になるので、画像全体を常に見なければ可能になると思います?! または、たとえば、すべての四角形ではなく画像全体をチェックする境界四角形が 10 個を超えるかどうかを判断することもできます。
次に、次のフレームを見て、特徴ベクトルを前のフレームと一致させようとします。そうすれば、オブジェクトを追跡できるようになります。これらのオブジェクトが画像の中央にある赤い線を超えると、別のイベントがトリガーされます。しかし、それはここでは重要ではありません。
その赤い線を横切っている、またはその後ろにあるすべてのオブジェクトがそのイベントをトリガーしているわけではないことを確認する必要があります。したがって、そのオブジェクトを含む少なくとも 2 つまたは 3 つの連続したフレームが必要であり、それが交差する場合にのみ、イベントがトリガーされます。
オブジェクト認識アルゴリズムのバリエーションが非常に多く、少し圧倒されます。Sift/Surf/Orb/... あなたは私が言っていることを理解します.
どちらを選択すべきか、または私がしていることに意味があるかどうか、誰かが私にヒントを与えることができますか?