問題タブ [sift]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
6488 参照

c++ - mysqlデータベースに保存されているSIFT機能の比較

現在、画像の分類に使用する画像ライブラリを拡張しています。重複する画像、変換された画像、および他の画像を含む、または他の画像に含まれる画像を検索したいと思います。
OpenCVからのSIFT実装をテストしましたが、非常にうまく機能しますが、複数のイメージではかなり遅くなります。スピードが速すぎる他の多くの画像関連のメタデータがすでにそこに保持されているので、特徴を抽出してデータベースに保存できると思いました。

新しい画像の特徴をデータベースの特徴と比較するための最速の方法は何でしょうか?
通常、比較は、kd-trees、FLANN、またはSOの別のスレッドで見つけたPyramid Match Kernelを使用してユークリッド距離を計算することで行われますが、まだあまり調べていません。

データベース内のkdツリーを効率的に保存および検索する方法がわからないため、現在3つのオプションしか表示されていません。
*確かに、データベース内のすべてのフィーチャまでのユークリッド距離をMySQLに計算させます。数枚以上の画像には不当な時間がかかります。
*最初にデータセット全体をメモリにロードし、kdツリーを構築します。これはおそらく高速ですが、非常にメモリを消費します。さらに、すべてのデータをデータベースから転送する必要があります。
*生成されたツリーをデータベースに保存してすべてをロードするのが最速の方法ですが、新しいイメージの場合と同様に、kdツリーを再構築してサーバーに送信する必要があるため大量のトラフィックも生成します。

私はOpenCVのSIFT実装を使用していますが、完全に設定されているわけではありません。このタスクにより適した(そしてほぼ同等に堅牢な)特徴抽出器があれば、誰かが提案してくれればうれしいです。

0 投票する
1 に答える
1911 参照

matlab - ふるい分け実装matlab

SIFTに関する以下の質問の答えをご存知の方がいらっしゃいましたら教えていただきたいです。

始める前に、次のリンクから David Lowe の論文の実装を参照してください。

http://www.cs.ubc.ca/~lowe/keypoints/

関数宣言は次のようになります。

出力パラメータがわかりませんlocs。記述子の場所をベクトルとして返します[x y scale orientation]か?

位置を指定する場合、xyは整数である必要がありますが、小数値を指定します。

0 投票する
3 に答える
1839 参照

sift - SIFT を使用した画像とその回転バージョンとの類似性

画像を比較するためにopencvにSIFTを実装しました...比較するためのプログラムをまだ作成していません.同じためにFLANNを使用することを考えています.しかし、私の問題は、記述子の128要素を調べて、画像とその回転バージョンの類似性。

Lowe の論文を読むと、記述子の座標がキーポイントの向きに関してすべて回転していることは理解できますが、類似度はどのくらい正確に得られるのでしょうか。

助けてください...これは私のプロジェクトのプレゼンテーション用です。

0 投票する
1 に答える
5748 参照

sift - ふるいにかけるユークリッド距離

私は自分のプロジェクトにSIFTを実装しようとしていましたが、キーポイントがあります。同じ画像のすべてのキーポイントを縮小して、画像の各キーポイントのユークリッド距離を取得してみました。クエリ画像の1つのキーポイントと、データベース画像の残りのキーポイントとの距離が非常に似ている場合があります。最近傍を選択するにはどうすればよいですか。また、これが正しい一致であることを確認するにはどうすればよいですか。

ユークリッド距離は、i = 1〜128 sqrt [(pi-qi)^ 2]、p = 1の場合、データベース内のキーポイントの数として計算されました。

どのように進めるかについてのアイデアは非常に高く評価されます

0 投票する
1 に答える
1472 参照

optimization - SIFT / SURF から得られた最も重要な機能の取得

SURF を使用して画像から特徴を抽出し、それらを他の画像と照合しています。私の問題は、一部の画像に 20000 を超える機能があり、クロールへの一致が遅くなることです。

そのセットから n 個の最も重要な機能のみを抽出する方法はありますか?

画像の MSER を計算してみましたが、それらの領域内にある機能のみを使用しました。これにより、マッチングの品質に悪影響を与えることなく、5% から 40% の範囲で削減できますが、信頼性が低く、まだ十分ではありません.
さらに画像のサイズを小さくすることもできますが、場合によっては機能の品質に深刻な影響を与えるようです.
SURF にはいくつかのパラメーター (ヘシアンのしきい値、オクターブ、オクターブごとのレイヤー) がありますが、これらの変更が機能の重要性にどのように影響するかについては何も見つかりませんでした。

0 投票する
4 に答える
11986 参照

c# - C# での SIFT の実装

C# で sift 実装を使いたい。

この Web サイトhttp://user.cs.tu-berlin.de/~nowozin/libsift/を見つけまし たが、メイン プログラムまたはプロジェクト ファイルがないことに混乱しています。通常の C# コンソール/ウィンドウ アプリケーションでどのように使用できるのか、GK# の規則とは何かを理解できませんでした。

誰かが私にいくつかの有用なヒントを教えてくれますか、またはC#での別の実装を知っている人はいますか?

0 投票する
3 に答える
2567 参照

opencv - SIFTとOpenCVでオブジェクトの画像を検索するには?

私は単純なトランプ検出プログラムに取り組んでいます。今のところ、ここから Sift Algorithmus が動作しています。そして、カードの周りにいくつかのバウンディング ボックスを作成しました。次に、検索するカードで Sift を使用し、記述子を保存しました。

しかし、次に何をすべきか?すべてのステップで Sift を実行している間、オブジェクトのマスクを作成し、バウンディング ボックスを通過する必要がありますか? それを正確に行う方法に関するチュートリアルが見つかりませんでした。

誰かが私を助けてくれることを願っています!

マックスに挨拶

編集:すべてのカードを認識したいので、次のように言うことができます:それはハート7かそこらです。

0 投票する
5 に答える
2747 参照

opencv - 実際のプロジェクト開発前の機能検出(SIFTなど)プロトタイピング用のOpenCVのGUIバージョン?

レンダリングされた3次元デジタルムービーから特定のオブジェクトまたはモデルを認識できるようにする必要があるという考えがありました。

限られた調査の結果、私が必要としているのは、コンピュータビジョンの分野での特徴検出と呼ばれるものであることがわかりました。

だから、私がしたいのは:

  1. 映画の特定のキャラクターのスクリーンショットをいくつか作成します(例:front / back / leftSide / rightSide)
  2. 映画を再生する
  3. 映画の再生中に、映画の新しいスクリーンショットを継続的に作成します
  4. スクリーンショットごとに、機能検出(SIFT?、openCV?を使用)を実行して、キャラクターの外観が存在するかどうかを確認します(キャラクターが遠くにあるために小さく見える場合、またはキャラクターが嘘をついている場合は、それらを認識しなければなりません。下)。
  5. キャラクターが見つかったら通知します

これはOpenCVで可能ですよね?

「問題」は、このアプリケーションを開発するためにc++またはpythonを学ぶ必要があるということです。私の映画とスクリーンショットが私がやりたいことに適用できるのであれば、これは問題ではありません。

そこで、最初に映画のスクリーンショットをテストしたいと思います。テストデータを入力し、プロトタイピングの手段としてその機能検出アルゴリズムを手動で実行できるOpenCVのGUIバージョンはありますか?

フィードバックをいただければ幸いです。ありがとう。

0 投票する
4 に答える
937 参照

sift - SIFTとのマッチング(概念)

私は現実世界の 2 つのイメージを持っています。(重要) ある現実世界から別の現実世界への変換についておおよそ知っています。テクスチャの問題により、2 つの画像間で十分な一致が得られません。SIFt を使用してより多くの正確な一致を取得するために、変換情報をどのように考慮に入れることができますか。どんなアイデアでも役に立ちます。

0 投票する
1 に答える
3923 参照

machine-learning - SIFT を使用した画像データベースの検索

SIFT アルゴリズムについていくつかの質問がされていますが、それらはすべて 2 つの画像の単純な比較に焦点を当てているようです。2 つの画像がどの程度似ているかを判断する代わりに、SIFT を使用して、何千もの画像のコレクションから最も一致する画像を見つけることが実用的でしょうか? つまり、SIFT はスケーラブルですか?

たとえば、SIFT を使用して画像のバッチのキーポイントを生成し、そのキーポイントをデータベースに保存してから、「クエリ」画像用に生成されたキーポイントまでのユークリッド距離が最も短いものを見つけることは実用的でしょうか?

ユークリッド距離を計算するとき、キーポイントの x、y、スケール、方向の部分を無視して、ディスクリプタだけを見ますか?