2

特徴抽出に ORB を使用し、分類に LDA を使用して、軽量のオブジェクト認識システムを構築しようとしています。しかし、抽出された特徴のさまざまなサイズに問題が発生しています。

これらは私のステップです:

  1. ORB を使用してキーポイントを抽出します。
  2. キーポイントをグループ化して、画像内のトレーニング可能な特徴を抽出します。(抽出されるものの例: http://imgur.com/gaQWk )
  3. 抽出された特徴を使用して認識エンジンをトレーニングします。(ここで問題が発生します)
  4. 野生の画像内のオブジェクトを分類します。

cv::gemm を使用して一般化された行列を作成しようとすると、さまざまなサイズが原因で例外が発生します。私が最初に考えたのは、すべての画像のサイズを変更して正規化することだけでしたが、オブジェクトのサイズが同様の小さな特徴を持つ場合、これは多くの精度の問題を引き起こします。

これに対する解決策はありますか?LDA はこれに適した方法ですか? fisherfaces などの顔認識アルゴリズムで一般的に使用されていることは知っています。

4

1 に答える 1

1

LDA では、ほとんどの最適化や機械学習の方法と同様に、固定長の機能が必要です。画像パッチのサイズを固定サイズに変更することもできますが、それはおそらく良い機能ではありません。通常、人々はSIFTなどのスケール不変機能を使用します。また、カラー ヒストグラム、またはGISTベクトルなどのエッジ検出と空間ヒストグラム ビニングのバリエーションを試すこともできます。

何を達成しようとしているのかを知らずに、LDA がこれに適した方法であるかどうかを判断するのは困難です。また、 SVM、何らかの形式のboosting、または大規模なトレーニング セットを持つ単純な最近傍の使用を検討することもできます。

于 2012-07-06T17:25:52.210 に答える