問題タブ [object-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1622 参照

computer-vision - OpenTLD、他のオブジェクト検出方法とどう違うのですか?

OpenTLDについて聞いたことがある人にとって、異なるオブジェクトの追跡をどのように交互に行うのでしょうか。一度に追跡できるオブジェクトは1つだけですが、同じビデオフィードで2つ以上のオブジェクトをトレーニングした場合、OpenTLDはどのように追跡対象を決定しますか?すべてのサンプルビデオで、ユーザーは追跡対象のオブジェクトを手動でバウンドし、その後、自動的に追跡されました。

これはオブジェクトトラッカーのみと見なされますか?そして、オブジェクト認識システムではありませんか?私はこれについて少し混乱しています。

私のアプリケーションでは、一度に1つのオブジェクトを追跡/検出することに問題はありませんが、別のオブジェクトを追跡するために切り替えるオプションがある場合に限ります。

たとえば、Haarのような機能の設定では、次のようになります。1.カップと本をいくつかのポジティブとネガティブを使用してトレーニングします。2。Haar認識ソフトウェアを起動すると、ソフトウェアがカップと本の両方を取得し、正しいラベル

理想的には、OpenTLDが行うと思う/希望/希望は次のとおりです。1。コンパイルされたexeを使用して、ビデオでカップをバインドし、追跡して学習します。2.ビデオで次のバインドされた本を追跡し、学習します。 、ライブビデオフィードで検出できるすべてのオブジェクトをプログラムに通知するようにプログラムに指示します。4.プログラムは、カップと本を検出し、そのうちの1つを追跡するオプションを提供することを教えてくれます

これは実行可能ですか?

0 投票する
1 に答える
3320 参照

image-recognition - オープンソースのオブジェクト認識アルゴリズム

私は、オブジェクト認識プログラムに使用する適切なアルゴリズムについて多くの検索を行ってきました。しかし、私が見つけたものにはすべて、いくつかの大きな欠陥がありました。

私のプログラムは、オンラインで新しいオブジェクトに遭遇したときにそれらを学習することになっています。新しいオブジェクトに遭遇すると、ボックスがその上にバインドされ、オブジェクトが学習されます(OpenTLDはこれを完全に実行します)。さまざまなオブジェクトに対してこれを数千回繰り返すと、プログラムは数千のクラスとオブジェクトのインスタンスを認識できる必要があります(Haarのような機能カスケードはこれを行うことができ、OpenTLDは失敗します)。アルゴリズムは、スケールと方向が不変である必要があります(Haarは失敗します)。

私が見つけたものはすべて、上記の基準の一部しか満たすことができず、残りは失敗しました。驚いたことに、私はまだすべての基準を満たすことができるものに出くわしました。HaarとOpenTLDは、私が必要としているものに最も近いものであるため、上記でのみ言及します。SIFT、SURFのような他のアルゴリズムは、私が必要としているものからさらに遠く離れています。

だから私の質問は、私が必要なことをする既存のソースコードはありますか?それとも、これは既存のソースコードを変更するだけで幸運が得られるものですか?

0 投票する
1 に答える
5240 参照

opencv - アフィン-SIFT(ASIFT)特徴検出器

私は、オブジェクトの特徴を(ビデオフレーム内で)検出し、それを他のオブジェクト(他のフレーム内)と照合して、追跡のために同じオブジェクトを認識しなければならないプロジェクトに取り組んでいます。私は多くの機能検出器アルゴリズムをグーグルで検索しました。また、それらの間でいくつかの比較を行いました(SIFT、SURF、およびASIFT)。

ASIFTは計算コストが少し高くなりますが、SIFT&SURFと比較すると結果はより正確です。私はASIFTについて多くのことをググったが、私のプロジェクトに関しては何の成功も得られなかった。

誰かが私のプロジェクトでASIFTを使用するのを手伝ってくれませんか?

ASIFTリファレンス: http ://www.ipol.im/pub/algo/my_affine_sift/

プロジェクトにどのファイルを含める必要がありますか?私はOPENCV2.1、IDEVS2010に取り組んでいます。このプラットフォームでの最初の投稿です。誰かが私を助けてくれることを願っています。

0 投票する
3 に答える
1220 参照

iphone - 拡張現実サービス用の無料のAPIはありますか?

現在、車、バス、建物、橋、人間などの画像上のオブジェクトを認識し、インターネットを利用してオブジェクト名としてラベル付けできるiPhone用のアプリを作成しようとしています。

オブジェクト認識自体がデジタル画像処理、ニューラルネットワークなどを必要とする複雑なアルゴリズムであるため、私の問題の解決策を提供する無料のサービスはありますか?

これはAPIを介して実行できますか?

0 投票する
2 に答える
5799 参照

image-processing - 分類と物体認識のために画像から特徴を抽出する方法は?

「特徴抽出」メソッドを作成する方法について混乱しています SVM を使用して画像に「オブジェクト認識」を適用したい , 猫の特徴を含む XML ファイルを保持する Emgu の例にサンプルがあります ! そして、私は彼らがどのようにそれを行ったのか、どのような方法を使用したのかを知るために一週間以来試みてきました .手順を表示するhtml ! とても複雑で、自分ではできませんでした。SVM学習と互換性のある「機能抽出」の適切な方法を誰か教えてもらえますか? AccordにはSVMの例がありますが、手書きであり、カラー画像を扱っていません=(ヘルプリンクはありますか?ありがとう

0 投票する
2 に答える
2079 参照

image-processing - いくつかの単純なオブジェクトをリアルタイムで追跡するためのアルゴリズム

人気のゲーム、League of Legendsをプレイしているときに、特定のオブジェクトの相対位置を追跡するプログラムを作成しようとしています。具体的には、現在画面に表示されている「ミニオン」のx、y画面座標を追跡したいと思います(「ミニオン」は、写真の中央にある小さな男で、頭に小さな赤と緑のバーがあります)。

私は現在、Java Robotクラスを使用して、プレイ中に画面キャプチャをプログラムに送信しています。ミニオンを見つけて、画面に表示されている限り追跡するための最適なアルゴリズムを見つけようとしています。

私の現在の考えは、畳み込みニューラルネットワークを使用して、頭の上の色付きのバーでミニオンを識別して特定することです。ただし、新しいフレームごとにミニオンを再識別して特定する必要があります。これをリアルタイム(〜10-60 fps)で実行したい場合は、計算コストが高くなるようです。

この種のコンピュータビジョンアルゴリズムは私の専門ではありませんが、ビデオ内のオブジェクトが連続的に移動する(つまり、フレーム間をジャンプしない)という事実を利用するアルゴリズムが存在することは合理的と思われます。

それで、このタスクを達成するための簡単に実装可能なアルゴリズムはありますか?

ここに画像の説明を入力してください

0 投票する
1 に答える
455 参照

image-processing - グレースケール イメージ内のオブジェクトをゼロ 1 配列としてスクリプト化する[]

キャプチャした画像のグレースケール オブジェクトを、オブジェクト ピクセルのブロック (またはオブジェクト スタイルのスケーリングのようなもの) を表す 0 1 のマトリックスとしてスクリプト化しようとしています。色のグレードに応じて、ただし、インテリジェントなツールまたはオープンソースのツールを探しています。

.NET が優先されます。

[更新、より詳細に説明する]

元の画像は色付きですが、256グレースケールに変換しています。次に、黒または白のみにスケーリングしたいので、最終的には白黒の画像になり、ゼロに変換したいです- 1 つのマトリックス、

次の URL には、imagemagick というソフトウェアを使用して白黒画像をゼロ 1 マトリックスに変換する方法の説明が含まれています。

http://studio.imagemagick.org/discourse-server/viewtopic.php?f=1&t=18433

ドラゴンの顔の画像を示すゼロ ワン マトリックスに注目してください。それを達成するのに役立つテクニックやオープン ソース ツールはありますか?

0 投票する
2 に答える
1769 参照

kinect - Kinectオブジェクト認識

私は、平らな表面と小さなオブジェクトを認識する必要があるKinectプロジェクトに取り組んでいます。Macマシンでopenniを使う予定です。では、オブジェクト認識にどのライブラリを使用する必要がありますか?このプロジェクトを完了するには、どのような知識が必要ですか。

0 投票する
3 に答える
2083 参照

image-processing - opencv を使用した円のパターンの検出

opencv を使用して 6 つの円のパターンを検出する必要があります。opencvでしきい値処理と輪郭関数を使用して、円とその重心を検出しました。

次に、これらの円の間の関係を、縮尺と回転に対して不変になるように定義する必要があります。これにより、さまざまなビューでこのパターンを検出できるようになります。オブジェクトのポーズを決定するには、このパターンを使用する必要があります。

スケール/回転の不変性を達成するにはどうすればよいですか? 私がそれについて読むことができる参照はありますか?

0 投票する
1 に答える
399 参照

computer-vision - SIFTと同様の機能を備えたCBIR、離散アプローチと連続アプローチ

現在、オブジェクト認識(オブジェクト分類の詳細)のためのCBIRシステムの実装を扱っていますが、機能検出器と記述子が機能しているので、コンテンツベースのタスクでこれらの機能を処理するための最良の方法を見つけようとしています。画像検索。

私の知る限り、このタスクには2つの主要な傾向があります。それは、離散的アプローチと連続的アプローチです。ここで、discreteは、テキスト検索を参照するメソッドを適用するための転置インデックスを構築するためのbag-of-visualワードやコードブックなどのメソッドを表し、continuousは、kdツリーと最近傍分類を使用したBestBinFirst検索などのメソッドを表します。

したがって、これら両方のアプローチの主な違いの1つは、1つは視覚的な単語などの機能の追加表現で機能し、もう1つは記述子から計算されたnD機能で機能することです。

私の質問は今、私のタスクに最適なアプローチを見つけるのに役立つ可能性のあるCBIRの2つの方法の比較はありますか?