私は現在、構築中のUAVのビジョンシステムに取り組んでいます。このシステムの目標は、地面の2Dフライオーバービューとなるビデオストリームで、かなり明確に定義されたターゲットオブジェクト(以下を参照)を見つけることです。これまでのところ、検出を行うために、Haarのような機能ベースのカスケードであるラビオラジョーンズをトレーニングして使用してみました。さまざまな角度(遠近法のシフト)と範囲(フレーム内のサイズ)でのターゲットの5000以上の画像を使用してトレーニングしていますが、「背景」画像は1900枚のみです。いくつかの誤検知と少数の誤検知のバランスをとるカスケードに適切な数のステージを見つけることができないため、これではまったく良い結果が得られません。
この分野の経験がある人から、次のことを行うべきかどうかについてアドバイスを求めています。1)カスケードを捨てて、輪郭と色で定義されたオブジェクトにより適したものを選びます(VJカスケードを読んだことがあります)いいえ)。2)ポジティブ、バックグラウンドフレームを追加する、それらをより適切に整理/撮影するなどして、カスケードのトレーニングセットを改善します。3)現在理解できない他のアプローチ。
ターゲットの説明:
- 主な形状:三角形、正方形、円、楕円など。
- はっきりとした、単色の、プライマリ(またはそれに近い)色。
- 2〜8フィートの最小寸法(数百フィートのAGLから簡単に確認できる大きさ)
- オブジェクトの中央にある大きな単一の英数字で、独自の明確な単色、原色、またはほぼ原色があります。
私の目標は、VJカスケードなどの非常に高速なものを使用して、可能なオブジェクトとそれに関連する境界ボックスを見つけ、それらをより細かい処理ルーチンに渡して、プロパティ(オブジェクトの色とAN、ANの値、実際の形状、およびGPS位置)。この目標を達成するために私にアドバイスをいただければ幸いです。私が現在持っているソースコードは、ここに投稿するには少し長いですが、参照用に見たい場合は無料で入手できます。前もって感謝します!
-JB