SIFT アルゴリズムについていくつかの質問がされていますが、それらはすべて 2 つの画像の単純な比較に焦点を当てているようです。2 つの画像がどの程度似ているかを判断する代わりに、SIFT を使用して、何千もの画像のコレクションから最も一致する画像を見つけることが実用的でしょうか? つまり、SIFT はスケーラブルですか?
たとえば、SIFT を使用して画像のバッチのキーポイントを生成し、そのキーポイントをデータベースに保存してから、「クエリ」画像用に生成されたキーポイントまでのユークリッド距離が最も短いものを見つけることは実用的でしょうか?
ユークリッド距離を計算するとき、キーポイントの x、y、スケール、方向の部分を無視して、ディスクリプタだけを見ますか?