私はOpenCVを始めたばかりで、コンピュータービジョンを備えたロボットを構築することを計画しています。このロボットに、オブジェクトのクラスと個々のインスタンスを認識させることを目指しています。ある意味で、一般的なクラスにはHaarのような機能があり、特定のインスタンスにはBIGGがあります。私は基本的に次のようなものを作りたいと思っています: http ://www.youtube.com/watch?v = fQ59dXOo63o ビデオではkinectが使用されていますが、使用するカメラは1つだけです。ビデオを見ると、kinectにオブジェクトが表示され、数秒後に新しいオブジェクトを認識するように学習することがわかります。これは本質的に私がやりたいことです。何千ものテンプレートを作成してソフトウェアを一度にトレーニングするのではなく、このプロセスを、ロボットが一度に1つのオブジェクトを学習する半手動のプロセスにしたいのです。学習するオブジェクトの種類に制限はありません。すべてが公正なゲームです。
トレーニングされる可能性のある大量のオブジェクトを扱っているため、パフォーマンスの問題が心配です。10,000個のオブジェクトをトレーニングしている場合、ラップトップがいくつかのアルゴリズムで窒息する可能性があると思います。私は現在、ドキュメントにあるさまざまなテクニックすべてにかなり圧倒されており、何が使用されているのかほとんどわかりません。
この問題にどのように取り組みますか?
ありがとう