3

Normal Bayes Classifier を使用してオブジェクト分類に sift を使用しようとしています。可変サイズの各画像の記述子を計算すると、異なるサイズの特徴ベクトルが得られます。例えば:

Feature Size: [128 x 39]

Feature Size: [128 x 54] 

Feature Size: [128 x 69]

Feature Size: [128 x 64]

Feature Size: [128 x 14]

開発に関しては、20 個のトレーニング画像を使用しているため、20 個のラベルがあります。私の分類は、車、本、ボールの 3 つのクラスのみです。したがって、ラベルのベクトル サイズは [1 x 20] です。

私が理解している限り、機械学習を実行するには、特徴ベクトルのサイズとラベルのベクトルのサイズを同じにする必要があるため、トレーニング データのベクトルのサイズを [__ x 20]、ラベルを [1 x 20] にする必要があります。

しかし、私の問題は、sift には 128 次元の特徴空間があり、上記のように各画像の特徴サイズが異なることです。機能を失わずにすべてを同じサイズに変換するにはどうすればよいですか? または、間違っている可能性があるので、これで私を助けてください?

PS:実際にBOWモデルを使用して実行しましたが、機能しますが、学習目的のためだけに興味を持って学習するために、この問題でそれを実行しようとしているので、ヒントやアドバイスは大歓迎です. ありがとうございました

4

2 に答える 2

4

そうです、SIFT 記述子は 128 次元の特徴です。

SIFT 記述子は、画像内で検出されたすべてのキーポイントに対して計算されます。記述子を計算する前に、おそらく検出器 (Harris、Sift、または Surf Detector など) を使用して、関心のあるポイントを検出しました。

キーポイントの検出と記述子の計算は、2 つの独立したステップです。

プログラムで印刷する場合 Feature Size: [128 x Y] 、Y は現在のイメージで検出されたキー ポイントの数を表します。

通常、BOW を使用すると、各キーポイント記述子に BOW 内の最も近いクラスターのインデックスを割り当てることができます。アプリケーションに応じて、決定を下すことができます... (シーン内の 1 つのオブジェクトの存在に投票するか ...)

于 2013-07-17T09:11:20.017 に答える
0

BOW を使用したくない場合は、Lowe による元の SIFT 論文で説明されているように、個々の SIFT 機能を一致させることができます。

基本的な考え方は、2 つの画像を比較して、似ているかどうかを判断することです。これを行うには、個々の SIFT 機能を比較します。それらが一致するかどうかを決定します。次に、空間位置が一貫しているかどうかを確認するには、一致した特徴をある画像から別の画像に変換できるかどうかを確認する必要があります。

これについては、 SIFT ウィキペディアの記事で詳しく説明されています。

于 2013-07-17T09:20:51.780 に答える