カスケード分類器に基づいてオブジェクト検出器を作成したいのですが、唯一の問題は、LBP と Haar の特徴が回転不変でないことです。最初に頭に浮かぶのは、トレーニング サンプルをさまざまな角度で回転させることですが、結果として得られる分類子の品質が高くなるとは思えません。さらに、オブジェクトのプロポーションが引き伸ばされる可能性もあります。回転不変の検出器はたくさんあります。たとえば、iPhone はあらゆる向きの顔をリアルタイムで認識しますが、どうやってこれを実現しているのでしょうか。これにはOpenCVを使用したいと思います。
4 に答える
https://github.com/nenadmarkus/picoで利用可能なオブジェクト検出フレームワークを確認してください。
このフレームワークを使用すると、カスタム オブジェクト検出器 (たとえば、正面の直立した顔を検出するため) を学習し、実行時にそれを使用して回転不変検出を行うことができます。
これは、オブジェクト検出器の回転バージョンを使用して、さまざまな向きで画像をスキャンすることによって実現されます。これは、カスケード再トレーニングや画像リサンプリングなしで実行でき、最新のマシンでリアルタイムで動作するはずです (提供されている顔検出デモでは動作します)。
詳細は、http://arxiv.org/abs/1305.4537で入手できる論文に記載されています。
フーリエ記述子は、回転不変量 (および平行移動とスケーリング不変量) です。アイデアは、フーリエ記述子の結果で快適な分類器をトレーニングすることです(SVMに関連付けられたフーリエ記述子のPCAは論理的な選択のようです)。
フーリエ記述子を参照してください(Wolfram)
一致するロゴについては、これが必要だと思います: http://www.ijera.com/papers/Vol2_issue5/JW2517421747.pdf
いくつかの簡単な解決策はどうですか....