computer-vision - バイナリ記述子の単語の袋

翻译自：https://stackoverflow.com/questions/37509053 2016-05-29T10:59:12.913

665 次

画像記述子の古典的なバッグオブワードパラダイムでは、次のことを行います。

各画像の一連の記述子を定義する
すべての画像のすべての記述子のセットで k-means をランチします。
その結果、各記述子はクラスターに割り当てられます。
「ビジュアルワード」 (つまり、ベクトルを介して画像を表現する方法) を定義します。各画像についてi-th、「ビジュアルワード」ベクトルの次元をクラスターに属する記述子の数として定義しi-thます。
k-dimension画像を表す「ビジュアルワード」ベクトルを取得しました。

このアプローチは、複雑で高価な SIFT 記述子に最適です...しかし、バイナリと高速記述子 (BRIEF、ORB、BRISK、FREAK など) についても同じですか?

この記事によると違いはありませんが、高価なk-meansアルゴリズムをバイナリ空間で効率的に計算できるかどうか (または、より優れたクラスタリングアルゴリズムがあるかどうか)、またはバイナリベクトルを使用したバッグオブワードモデルの代替アプローチがあるかどうかは疑問です。

0 に答える 0