問題タブ [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Kinect深度配列から位置(x、y)を取得するには?
kinect を使用しているときに、ビットマップとその深度情報が信頼できず、何らかの理由で実際のバイト配列のデータよりもはるかに乱れていることがわかりました。
このようにビットマップにアクセスして最小値と最大値を取得しようとしたときにこれに気付きました
しかし、一方で、この方法で深さバイト配列に直接アクセスすると、はるかに優れた結果が得られました (Stackoverflow メンバーのクリスが指摘したように、ありがとう、クリス)。
私の質問は:
- 特定の距離間隔内のすべてのポイントをカウントしたい。
- 次に、実際の位置(x、y)を取得したいと思います。
位置を取得したり、それらのポイントをリストに直接追加したりするにはどうすればよいですか?
私の最終的な目標は、特定の間隔内のピクセル数を数えることによって、特定の事前定義されたオブジェクトを識別することです (たとえば、ボールとブロックを区別するため)。
algorithm - 画像内のUI要素を認識する方法は?
私は自動化ツールを作成しようとしており、スクリーンショットを取り、ユーザー入力を記録するタイプの記録を試しています。アイデアは、ユーザーがスナップショットを撮り、「送信」ボタンのスナップショットの四角を強調表示することです。再生中、プログラムは開いているウィンドウのスクリーンショットを撮り、スナップショットを検索してボタンの座標を見つけます。したがって、画像からボタンの正確な (または非常に近い) 画像を検索するアルゴリズムが必要です。私がこれまでに見つけたアルゴリズムは、画像の類似性を比較しますが、サブイメージでそれを見つけることができず、オブジェクト認識のアルゴリズムは、私が見つけようとしている「オブジェクト」がほぼ完全に一致することを考えると、少し過剰に思えます。何か案は?
opencv - openCV でのウィンドウの検出
ウィンドウを検出しようとしています (real-life-house-windows)。コーナー検出を使用するだけでは、必ずしも十分ではありません。だから私は窓を認識するためのパターンを見つけようとしています..光の違い(窓から来る太陽)も検出することは良い考えかもしれないと思いました. しかし、そのデータを区別することはできませんでした。ウィンドウを検出するためのパターンに対して定義できる特定の機能について、アイデアを共有していただけますか?
opencv - 2 つの異なるカスケード分類器を使用して検出する方法
2 つの異なるカスケード分類子を使用して、2 つの異なるオブジェクトを認識しようとしています。顔認識サンプルを変更しましたが、問題があります。object1.xml からオブジェクトを認識しようとすると、両方の長方形が印刷され、object2.xml からオブジェクトを認識しようとすると、何も印刷されません...
問題はどこだ??
>
または、同じ .xml から異なるオブジェクトを検出する方法はありますか??
解決した
この方法でコードを更新します。
これが結果です: http://i43.tinypic.com/15eqvl.png
android - All my questions about opencv_traincascade
it's some weeks that I try to create a good cascade classifier but it seems that this process is surrounded by mystery. I have a lot of questions:
1) Why opencv give us so little information?
2) It needs more positive images or negative images?
3) What size should have positive images? And negative images? They must have all the same size?
4) if I want to create a classifier for a single road sign is enough a single positive image like this to create samples with opencv_createsamples?
5) To create a classifier used on an android app is better Haar or LBP?
6) what is the right number of stages?
7) What is the right value for minHitRate and maxFalseAlarmRate?
matlab - 画像内の円形に近いオブジェクトをカウントする方法
以下のような画像があります。その中で、すべての赤い円を見つけて数える必要があります。そのため、MATLAB R2011a と Image Processing Toolkit を使用することを考えています。どうすればそれらを抽出できますか?
c++ - どのオブジェクト認識アルゴリズムを使用すればよいですか?
私はCVにかなり慣れていないので、愚かな質問を許してください...
やりたいこと:
ライブ ビデオで RC 飛行機を認識したい (今のところ、記録されたビデオのみ)。
私がこれまでに行ったこと:
- フレームの違い
- グレースケールに変換する
- ガウスぼかし
- しきい値
- 輪郭を見つける
フレームの例を次に示します。
ただし、ノイズのあるフレームもあるため、フレーム内にはより多くのオブジェクトがあります。
私はこのようなことができると思いました:
見つかったすべての輪郭に対して何らかのオブジェクト認識アルゴリズムを使用します。そして、これらの境界矩形のそれぞれについて特徴ベクトルのみを計算します。
画像の特定のパッチ (小さい部分) に対してのみ SURF/SIFT/... を計算することは可能ですか?
アルゴリズムがリアルタイムのビデオを処理できることが重要になるので、画像全体を常に見なければ可能になると思います?! または、たとえば、すべての四角形ではなく画像全体をチェックする境界四角形が 10 個を超えるかどうかを判断することもできます。
次に、次のフレームを見て、特徴ベクトルを前のフレームと一致させようとします。そうすれば、オブジェクトを追跡できるようになります。これらのオブジェクトが画像の中央にある赤い線を超えると、別のイベントがトリガーされます。しかし、それはここでは重要ではありません。
その赤い線を横切っている、またはその後ろにあるすべてのオブジェクトがそのイベントをトリガーしているわけではないことを確認する必要があります。したがって、そのオブジェクトを含む少なくとも 2 つまたは 3 つの連続したフレームが必要であり、それが交差する場合にのみ、イベントがトリガーされます。
オブジェクト認識アルゴリズムのバリエーションが非常に多く、少し圧倒されます。Sift/Surf/Orb/... あなたは私が言っていることを理解します.
どちらを選択すべきか、または私がしていることに意味があるかどうか、誰かが私にヒントを与えることができますか?
matlab - 識別的にトレーニングされたパーツベースのモデルを使用してオブジェクト検出でパーツスコアを取得する方法
http://www.cs.berkeley.edu/~rbg/latent/voc-release5.tgzで入手できるコードは、オブジェクト検出で広く使用されています。ds、bs、treesを返すimgdetect関数があります。dsには検出ボックスが含まれており、bsには検出に使用されたフィルターのどれが画像で応答したかが含まれているようですが、treesには部分スコアに関する情報が含まれています。treesとbsを使用してパート スコアを取得する方法を見つけることができませんでした. 基本的に、検出ボックスが与えられた場合、検出に応答したフィルターと、オブジェクトの検出に使用された各フィルター (サブ パーツ) のスコアを調べたいと思います。
opencv - 輪郭と特徴による物体認識
環境:
私は Kinect から RGB-D ビデオを持っています。これはテーブルに向けられています。単独で、または一度にいくつかを識別する必要がある約 12 個のオブジェクトのライブラリがあります。SURF を適用する前に、RGB 画像からの SURF の抽出と検出、320x240、グレースケールへのダウンスケーリング、コントラストのストレッチ、ヒストグラムのバランス調整による前処理を行ってきました。ビデオ画像の静止画で検出されたキーポイントの中から選択する投げ縄ツールを作成しました。次に、これらのキーポイントを使用して、ライブ ビデオ フィード内のオブジェクトを識別するために使用されるオブジェクト記述子を作成します。
問題:
SURF の例は、適切な量のテキストのような特徴の詳細を持つオブジェクトの識別に成功したことを示しています。ロゴとパターン。識別する必要のあるオブジェクトは比較的単純ですが、特徴的な形状をしています。私の静止画で見つかった SURF の特徴は、一貫している場合もありますが、ほとんどが重要でない表面の特徴です。たとえば、木の立方体があるとします。SURF は 1 つの面で数ビットの粒子を検出し、他の面では失敗します。等距離で直角に 4 つの角があることを検出する必要があります。私のオブジェクトはどれもあまりパターンを持っていませんが、すべてが独特の対称的な形状と色を持っています. 携帯電話、ロリポップ、ナイフ、ボウリングのピンを考えてみてください。私の考えでは、オブジェクトの見た目が大きく異なる方向ごとにオブジェクト記述子を構築できると考えていました。ボウリング ピンの 2 つの記述子: 1 つは立っていて、もう 1 つは横になっています。携帯電話の場合、1 つを前面に置き、もう 1 つを背面に置きます。私のレコグナイザーには、オブジェクトが積み重ねられている場合に、回転不変性とある程度のスケール不変性が必要です。ある程度のオクルージョンに対処できることは望ましいことですが (SURF は十分に動作します)、最も重要な特性ではありません。スキュー不変性が望ましいと思われます。SURF は、手で持った対象物を斜めに印刷した紙に適しています。
質問:
間違った縮尺でフィーチャを見つけるために間違った SURF パラメータを使用していませんか? この種のオブジェクト識別のためのより良いアルゴリズムはありますか? Kinect の深度データを RGB データと共に、またはその代わりに使用する SURF のようにすぐに使用できるものはありますか?