問題タブ [keypoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
673 参照

c++ - OpenCV を使用して機能ベースのローカリゼーションを行う方法はありますか?

OpenCV 機能検出を使用して、LIDAR の結果と仮想マップの比較に基づいてロボットの位置を推定しています。orb 機能検出に続いて flannbasedmatcher を使用してみましたが、一致結果が間違っていました。ここに私のコードの一部があります

これが結果です。 検出は大丈夫そうですが、2番目の画像を回転させるとひどいです

フランマッチャーは、スケーリングも回転もされていない画像でのみ機能しますか? フランを使用してバイカラー イメージ (BW) を一致させることはできますか? または、誰かが私が間違っているところを指摘できますか? 前もって感謝します

0 投票する
1 に答える
702 参照

java - JavaのOpenCVのKeyPointとMatchDpointとは

親愛なる 1-私は Point クラスが 2 つのチャネル整数値座標 (ポイント) に関するものであることを知っています: MatOfPoint が整数ポイントのベクトルであるように。KeyPointクラスと同じですか?私はそれが顕著な点を含むクラスであることを知っています.それらを2つのチャネルの浮動小数点値の座標(点)として見るのは本当ですか? 以下の行を見てください。

KeyPoint に関する私の解釈が有効かどうかを確認するために書きました。これを検証してください。

2-Dmatch match.trainIdx とは? つまり、trainIdx とは何ですか?

平和

0 投票する
0 に答える
63 参照

c++ - RGB-D 画像の記述子の再現精度を計算する方法

最近、RGB-D 画像の記述子に関する研究を行っていますが、現在、再現精度を計算する方法に関する問題に直面しています。

私の直接的な考えは、まず、キーポイントを検出して記述した後、2 つの深度画像をそれぞれ点群に変換することです。次に、グラウンド トゥルース データ (回転行列とベクトル) を使用して、2 つの点群をワールド座標系に変換します。3 番目に、単一の点群で行うことと同じように再現精度を計算するだけです。

私の考えが正しければ、私の実験にはいくつかの疑問があります。RGB 画像のキーポイントは、対応する深度画像でゼロの値を持つ可能性があるため、RGB 画像で実際に一致するキーポイントは、変換された点群で一致しない可能性があります。

再現精度を正しく計算するにはどうすればよいですか?

0 投票する
3 に答える
1853 参照

c++ - GridAdaptedFeatureDetector は OpenCV 3.1 から姿を消しましたか?

ビデオ ファイル内の画像からオブジェクトを認識するアルゴリズムに取り組んでいます。今のところ、ORB を使用したいと考えています (この種の作業では SURF と SIFT が優れていることはわかっていますが、私の結果に基づいてこれを断言したいと思います)。ここで問題が 1 つあります。プログラムを実行すると、画像の 1 つでキーポイントが他の画像とは異なる領域で検出され、一致するものがほとんど見つかりません。現在、OpenCV 2.4 には GridAdaptedFeatureDetector がありました。これは、ソース イメージをグリッドに分割し、各セル内のポイントを検出できるクラスです。しかし、私はOpenCV 3.1(Visual Studio 2015)を使用していますが、消えたようですか? 解決策を見つけるのを手伝ってください。

0 投票する
3 に答える
1017 参照

python - Dlib で大きな (2000x2000 以上の) 画像を操作すると、画面に収まりません

そのため、数週間後、ようやく Dlib をインストールすることができましたが、すぐに別の問題に遭遇しました。

私は彼らの顔ランドマーク検出器をダウンロードして実行しました: http://dlib.net/face_landmark_detection.py.htmlそして、実際のプログラムは問題なく動作しますが、大きな画像で実行しようとすると:

ここに画像の説明を入力

画像が画面に収まりません:

ここに画像の説明を入力

実際のキーマーク エクストラクタのコードは次のとおりです。

また、Dlib のドキュメントをくまなく調べても、ghewin.set_image()win.add_overlay()関数のウィンドウ サイズについて言及されていません。

ウィンドウを小さくするにはどうすればよいですか?