Fisher Vector について読んだことがありますが、まだ学習中です。これは、GMM (または通常 VLAD と呼ばれる場合でも k-means) を利用した従来の BoF 表現よりも優れた表現です。
ただし、通常、SVM などの分類問題に使用されることがわかりました。
しかし、画像検索はどうでしょうか? それらが画像の検索にも使用されているのを見てきましたが (こちら)、1 つの点がわかりません。
そのような状況でそれらを使用することは合理的ですか?
Fisher Vector について読んだことがありますが、まだ学習中です。これは、GMM (または通常 VLAD と呼ばれる場合でも k-means) を利用した従来の BoF 表現よりも優れた表現です。
ただし、通常、SVM などの分類問題に使用されることがわかりました。
しかし、画像検索はどうでしょうか? それらが画像の検索にも使用されているのを見てきましたが (こちら)、1 つの点がわかりません。
そのような状況でそれらを使用することは合理的ですか?
以下の 2 つの論文に見られるように、ユークリッド距離が一般的な選択肢のようです。類似度の尺度として内積を使用することへの言及もあります。コサイン類似度 (密接に関連) は、ML 類似度の一般的な指標です。
http://link.springer.com/article/10.1007/s11263-013-0636-x
http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf
ニーズに合ったものを選択するには、これで十分ですか?