image - bag of words による画像検索 (CBIR)

Question

コンテンツベースの画像検索に bag of words を使用したい。bag-of-words をコンテンツベースの画像検索に適用する方法について混乱しています。明確にするために：

SURF 機能を使用してプログラムをトレーニングし、BoW 記述子を抽出しました。これをサポートベクターマシンにトレーニングデータとしてフィードします。次に、クエリ画像が与えられると、サポートベクターマシンは、特定の画像がどのクラスに属するかを予測できます。

言い換えれば、クエリ画像が与えられると、クラスを見つけることができます。たとえば、車の画像をクエリすると、プログラムは「車」を返します。似たような画像を見つけるにはどうすればよいでしょうか。

クラスが与えられた場合、トレーニングセットから画像を返すでしょうか? それとも、クエリ画像を指定すると、プログラムは、SVM が同じクラスを予測するテストセットのサブセットも返すでしょうか?

score 0 · Accepted Answer

タイトルはBoWについてのみ言及していますが、テキストではSVMも使用しています。

CBIR の核となるアイデアは、距離の測度に従って、最も類似した画像を見つけることだと思います。これは、BoW 機能を使用して行うことができます。SVM は必要ありません。

追加の分類を使用する主な目的は、プロセスを高速化することです。テストイメージのクラスラベルを取得した後は、イメージのこのサブグループを検索して最も一致するものを検索するだけで済みます。そしてもちろん、SVM が特定のクラスの識別において距離測定よりも優れている場合、エラーを減らすのに役立つ可能性があります。

したがって、標準的なワークフローは次のようになります。

クラスを取得する
このクラスのトレーニングサンプルから最適な一致を返す

image - bag of words による画像検索 (CBIR)

1 に答える 1

Related

Reference