問題タブ [feature-descriptor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
665 参照

computer-vision - バイナリ記述子の単語の袋

画像記述子の古典的なバッグ オブ ワード パラダイムでは、次のことを行います。

  1. 各画像の一連の記述子を定義する
  2. すべての画像のすべての記述子のセットで k-means をランチします。
  3. その結果、各記述子はクラスターに割り当てられます。
  4. 「ビジュアル ワード」 (つまり、ベクトルを介して画像を表現する方法) を定義します。各画像についてi-th、「ビジュアル ワード」ベクトルの次元をクラスターに属する記述子の数として定義しi-thます。
  5. k-dimension画像を表す「ビジュアル ワード」ベクトルを取得しました。

このアプローチは、複雑で高価な SIFT 記述子に最適です...しかし、バイナリと高速記述子 (BRIEF、ORB、BRISK、FREAK など) についても同じですか?

この記事によると違いはありませんが、高価なk-meansアルゴリズムをバイナリ空間で効率的に計算できるかどうか (または、より優れたクラスタリング アルゴリズムがあるかどうか)、またはバイナリ ベクトルを使用したバッグ オブ ワード モデルの代替アプローチがあるかどうかは疑問です。

0 投票する
1 に答える
176 参照

opencv - 機能記述子テストを比較していますか?

どちらがより適しているかを理解するために、画像データセットの精度再現率と計算時間の観点から、さまざまな記述子 (SIFT、SURF、ORB、 LATCHなど)をテストしたいと思います。

この目的のために OpenCV にビルド済みのテスターはありますか? 他の代替案やガイドラインはありますか?

0 投票する
0 に答える
265 参照

feature-detection - 特徴照合におけるバイナリ記述子

SO コミュニティの皆様へ

皆さんが私をSOに歓迎してくれることを願っています.

機能検出器、記述子、およびマッチャーについて学びたかっただけです。

私は研究活動の後で検出器と記述子について明確になり、記述子は画像内で検出された検出器を記述するために使用されることを知りました。ディスクリプタは、回転、向き、スケール不変である必要があります。すべての記述子には対応する検出器がありますが、記述子を使用してすべての機能を記述することはできないため、その逆はありません。このトピックに関する明確な説明は、opencv.org のドキュメントに記載されており、私はそれを読みました。

ここで私の疑問は、

バイナリ記述子に関するこのチュートリアルを読んだ後

https://gilscvblog.com/2013/08/26/tutorial-on-binary-descriptors-part-1/

私はそれが何であるかについていくつかのアイデアを得ました。要するに

1) 画像 A の 512 ペアのパッチ

2) 各ペアの強度をペアの 1 番目の値および 2 番目の値と比較します。最初の値が大きい場合は 1 を、そうでない場合は 0 を配置します。

3) これで、1 と 0 で構成される約 512 の 2 進数が得られます。なるがままに

4) 異なる画像「B」のパッチで上記の 3 つの手順を繰り返します。また、512 の 2 進数があります。としましょう

5) 次に、これら 2 つのバイナリ文字列間のハミング距離を実行します (XOR 演算)

6) ハミング距離を実行した後の結果は

これが私の質問ですか?

1) このステップの後はどうなりますか?

2) ある画像から別の画像への線の引き方。そのようなものに一致する距離を使用していることを知りました。

機能マッチング

記述子の間に線を引くために画像に適用されるものを実際に学びたかっただけです(記述子マッチャー-それがどのように機能するか)。

このトピックに関するヘルプを求めています。

0 投票する
0 に答える
67 参照

image-processing - シルエットのヒストグラムの意味は?

シルエットは、たとえば背景の減算を使用して得られる人物の体であることは知っています。しかし、シルエットのヒストグラムとその利点は何ですか。

多くの論文で、シルエットのヒストグラムが認識の特徴として使用されていることを読んだことがあります。

ご協力いただきありがとうございます、

よろしく

0 投票する
0 に答える
471 参照

feature-extraction - ORBの実装

ORB のオープン ソース実装を使用しました。

新しいモジュールを追加して ORB をさらに実装するにはどうすればよいですか?

ORB を使用するだけでなく、より良い結果を得るために、私は自分の側から何ができますか?

外れ値を排除し、より良い結果を得るために RANSAC を使用することを考えています。

この時点で、ORB をさらに実装するためのアイデアを待っています。

円形および三角形のホモグラフィの実装に関するアイデアはありますか?

0 投票する
1 に答える
321 参照

degrees - mahotas.features.zernike_moments の戻り値の意味は何ですか

以下のこの関数を使用して、画像のゼルニケモーメントを計算しました。

degree=8 に設定すると、25 個の戻り値が得られます。なぜ私が25個の値を取得したのか、そしてそれらは何なのか説明してもらえますか?

この「度」とは何ですか?ラジアル度ですか、それともアジマス度ですか?

この結果をウィキペディアの知識と関連付けるのは困難です。たとえば、次数 = 2 を設定すると、4 つの値が返されます。しかし、ウィキペディアから、放射次数 = 2 の 3 つの多項式と、放射次数 <= 2 の合計 6 つの多項式があります。なぜですか?