オブジェクト認識に関する小さなプロジェクトを行いたいのですが、このトピックに関するツールや文献の提案はありますか?
4 に答える
Opencv
alt テキスト http://img.amazon.ca/images/I/51wL-eaIHpL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA300_SH20_OU15_.jpg
これは無料で、c/c++ および python から使用できます。そして、多くのコミュニティと、それに基づく多くの例と大学のコースがあります。
コピー (または予備のお金) がある場合の代替手段は matlab です。
文学:
プロジェクトでは、おそらく画像処理技術を使用する必要があります。この分野の非常に優れた入門書は、Gonzalez と Woods によるDigital Image Processingです。画像のセグメンテーションなどのトピックをカバーしています。これは、認識されるオブジェクトを画像の残りの部分から分離するために使用される手法です。
入力画像内のオブジェクトを特定したら、次のステップは、それらが互いにどの程度似ているかを測定する方法を見つけることです。おそらく、これを行う最善の方法は、イメージ記述子を使用することです。通常、物体認識の場合、記述子の最良のクラスは形状に基づく記述子です。Zhang D. と Lu G. による記事「形状表現と記述手法のレビュー」は、形状記述子に関する優れたレビューを提供します。
最後に、それらのオブジェクトを分類する必要があります。[Machine Learning] by Mitchell は、プロジェクトで使用できるk-NNなどの手法について説明している古典的な本です。
ツール:
OpenCV または Matlab。私は特に OpenCV を使用しており、次の理由でとても気に入っています。
- 非常に優れたドキュメントと、それに関する優れた書籍やチュートリアルが多数あります。
- Otsu メソッドや Watershed などの多数のセグメンテーション アルゴリズムの実装。
- 基本的な GUI とメディア IO を提供します。
Processing ( http://processing.org/ ) とさまざまなコンピューター ビジョン ライブラリ、特に OpenCV ( http://ubaa.net/shared/processing/opencv/ ) を用意して使用するのが良い遊び場です。組み込みまたは外部の USB カメラから簡単にフレームを取得するためのライブラリは必要ありません。これはそのまま使用できるためです。
Processing を使ったプログラミングは非常に簡単なので、USB カメラを接続すると、すぐに面白いことを始めることができます。つまり、私はすぐに顔を検出して追跡し、被写体の背景がありません.
また、オブジェクト認識用の Adobe Flash も調査してください。真剣に。