0

私はOpenCVを始めたばかりで、コンピュータービジョンを備えたロボットを構築することを計画しています。このロボットに、オブジェクトのクラスと個々のインスタンスを認識させることを目指しています。ある意味で、一般的なクラスにはHaarのような機能があり、特定のインスタンスにはBIGGがあります。私は基本的に次のようなものを作りたいと思っています: http ://www.youtube.com/watch?v = fQ59dXOo63o ビデオではkinectが使用されていますが、使用するカメラは1つだけです。ビデオを見ると、kinectにオブジェクトが表示され、数秒後に新しいオブジェクトを認識するように学習することがわかります。これは本質的に私がやりたいことです。何千ものテンプレートを作成してソフトウェアを一度にトレーニングするのではなく、このプロセスを、ロボットが一度に1つのオブジェクトを学習する半手動のプロセスにしたいのです。学習するオブジェクトの種類に制限はありません。すべてが公正なゲームです。

トレーニングされる可能性のある大量のオブジェクトを扱っているため、パフォーマンスの問題が心配です。10,000個のオブジェクトをトレーニングしている場合、ラップトップがいくつかのアルゴリズムで窒息する可能性があると思います。私は現在、ドキュメントにあるさまざまなテクニックすべてにかなり圧倒されており、何が使用されているのかほとんどわかりません。

この問題にどのように取り組みますか?

ありがとう

4

1 に答える 1

1

あなたが尋ねた質問は次のとおりです(あなたが気づいているかどうかにかかわらず):

  • 物体検出
  • オブジェクトの分類
  • 物体認識
  • セグメンテーション
  • 正規化
  • 機械学習

それぞれがそれ自体が完全な主題であり、ニーズに対する「正しい」答えはありません。実験して、問題のドメインに適したアルゴリズムの魔法の組み合わせを見つける必要があります。

また、キネクトには、通常のカメラにはない、奥行きという利点があります。従来の 2D 認識はとてつもなく難しいものです。

ただし、有用な答えを提供するという精神で、人間の物体検出機能をシミュレートする Nicolas Pinto による V1 アルゴリズムを確認してください。

http://pinto.scripts.mit.edu/Code/Code

于 2011-09-30T22:12:00.100 に答える