問題タブ [sift]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2463 参照

computer-vision - おおよその最近傍は、コンピューター ビジョンで最も高速な機能マッチングですか?

特徴記述子 [SIFT、SURF など] を使用する場合 - 近似最近傍は画像間のマッチングを行うための最速の方法ですか?

0 投票する
6 に答える
11655 参照

java - 拡張現実に SIFT を使用する

私は多くの AR ライブラリ/SDK/API に出くわしました。それらはすべてマーカーベースです。説明とコメントから、このビデオを見つけるまで、彼は SIFT を使用してオブジェクトを検出し、それを追跡しているようです。

Android でこれを行う必要があるため、純粋な Java で SIFT を完全に実装する必要があります。

喜んでそれを行いますが、最初に SIFT が拡張現実にどのように使用されるかを知る必要があります。

私はあなたが与える情報を利用することができます。

0 投票する
7 に答える
21612 参照

algorithm - 拡張現実のためのSURFおよびSIFT代替オブジェクト追跡アルゴリズム

ここで質問し、SURFとSIFTの両方を試した後、どちらも、カメラからのストリームを追跡するのに十分な速さでインタレストポイントを生成するのに十分な効率であるとは言えません。

たとえば、SURFは画像のインタレストポイントを生成するのに約3秒かかります。これは、Webカメラからのビデオを追跡するには遅すぎます。携帯電話で使用すると、さらに悪化します。

特定の領域、そのスケール、傾斜などを追跡するアルゴリズムが必要なだけで、その上に構築できます。

ありがとう

0 投票する
5 に答える
58825 参照

matlab - SIFTアルゴリズムを使用して、2つの画像がどの程度類似しているかを計算するにはどうすればよいですか?

Andrea VedaldiのSIFT実装を使用して、2つの類似した画像のふるい分け記述子を計算しました(2番目の画像は、実際には同じオブジェクトを異なる角度から拡大した画像です)。

今、私は記述子を比較して画像がどれほど似ているかを知る方法を理解することができませんか?

こういうことを実際にやってみないと答えられないことは知っていますが、これまでにやったことがある人も知っているのではないかと思い、質問を投稿しました。

記述子を生成するために私がしたこと:

0 投票する
4 に答える
1286 参照

image - 画像登録

簡単な画像登録を行う方法に関するアイデアはありますか (同じ被写体から IMAGE1 と IMAGE2 を取得していますが、カメラが少し動いており、IMAGE2 と IMAGE1 を一致させたいと考えています)。それを行うために多くのソフトウェアをチェックしましたが、それらはすべて医療画像に焦点を当てているため、単純な JPEG を入力できませんでした (1 つは PGM を許可していましたが、機能しませんでした)。

ありがとう

0 投票する
2 に答える
6764 参照

data-structures - 語彙ツリーとは何ですか?また、その構築方法は?

大規模なデータベースで類似の画像やテキストを高速にクエリすることに関しては、ボキャブラリ ツリーについてよく読んでいます。しかし、そのようなボキャブラリ ツリーとは何か、機能の 1 つを構築する方法について、適切な (理解しやすい) 説明を見つけることができませんでした。

0 投票する
2 に答える
16523 参照

matlab - Matlab の SIFT アルゴリズム

SIFT アルゴリズムの Matlab 実装を探しています。

0 投票する
3 に答える
4848 参照

image-processing - SIFT での DoG Pyramid の使用方法

私は画像処理とパターン認識の初心者です。DoG ピラミッドを作成し、各オクターブで局所的な最大値または最小値を特定できる SIFT アルゴリズムを実装しようとしています。私が理解していないのは、各オクターブでこれらのローカル最大/最小を使用する方法です。これらのポイントをどのように組み合わせますか?

私の質問は非常に些細なことに聞こえるかもしれません。私は Lowe の論文を読みましたが、DoG ピラミッドを構築した後に彼が何をしたかを本当に理解できませんでした。どんな助けでも大歓迎です。

ありがとうございました

0 投票する
1 に答える
2659 参照

computer-vision - 最近隣アルゴリズムの距離メトリックの代替?

2 つの類似した画像内の特定のキーポイント間の一致を見つけるための最近傍アルゴリズムの実装に出会いました。キーポイントは、SIFT アルゴリズムによって生成されました。ポイントは 128 次元のベクトルで記述され、両方の画像にそのようなポイントが多数あります。

マッチング アルゴリズムは最近傍検索を使用し、1 つのイメージ内の各ポイントに対して、もう 1 つのイメージ内の対応する最も近いポイントを計算します。「近さ」は、ポイントのベクトル間の最小ユークリッド距離によって表されます。そのような最良の一致は、距離が特定のしきい値を下回るポイントのペアのみを取得することによって選択されます。

しかし、私が遭遇した実装では、一方の画像のキーポイントのすべてのベクトルをもう一方の画像のベクトルと乗算し、積の行列を形成します。次に、積が所定のしきい値よりも高い点を見つけます。

この実装は正しい結果をもたらしますが、それがどのように機能するか知りたいです。ベクトル間の相関をメトリックとして使用しますか、それともここで何か他のことが起こっていますか?

0 投票する
2 に答える
1051 参照

image-processing - 画像内の特定の特徴の存在を検出するための優れた方法

私はビデオチャットをしましたが、いつものように、多くの男性はサービスを悪用するのが好きです(そのような悪用の性質を理解するのはあなたに任せています)、これは私が決して支持するものではなく、ほとんどのこともしません私のユーザーの。いいえ、chatroulette.comを盗んだことはありません:-)率直に言って、これをここで取り上げるのは恥ずかしいことですが、私の質問は技術的でかなり具体的です。

ユーザーがカメラでジャンクをフラッシュするなど、このコンテンツが不快なキャラクターである場合は、ビデオコンテンツに基づいてユーザーをフィルタリング/拒否したいと思います。どのような画像比較アルゴリズムが私のニーズに合っていますか?

私は1週間ほど科学論文を読んで、SIFT、SURF、ウェーブレットベースのアプローチなど、複数の理論とその実装に気づきました。もちろん、これらにはそれぞれ欠点と利点があります。しかし、私の画像比較の性質は非常に具体的であるため、ビデオで特定の身体部分がさまざまな位置で遭遇した場合にサービスを拒否するために、どの方法が私に最も適しているのか疑問に思っていますか?

現在、私は次のようなものに傾倒しています(ウェーブレットベースに加えて、独自のイノベーションであると思われるもの):http: //grail.cs.washington.edu/projects/query/

以上のことで、問題のある身体部分を簡単に描くことができ、問題のあるコンテンツはしきい値に基づいて一致と見なされると期待できます。繰り返しになりますが、この方法が変換に対して不変であるかどうか、もしそうであれば、どのような種類であるかはわかりません。この論文はそれについて具体的ではありません。

あるいは、SURFの実装で可能だと思っていますが、誤検知が発生する可能性があるのではないかと心配しています。そのような実装は、特定の機能を認識/重視するようにトレーニングできますか?

ここでSURFとSIFTについて多くの質問があることは承知していますが、それらのほとんどは、通常2つの画像を「比較」する方法を説明しているという点で一般的です。私の比較は機能固有であり、一般的なものではありません。2つの類似した画像を比較するだけでなく、その中に存在する特徴のランク/インデックス/重みを与えることができる方法が必要です(ただし、この方法では、画像自体か何か他のものかを問わず、それを説明できます)。画像。