画像を取得し、画像内に存在するオブジェクトを取得して処理する (情報を提供する) ために使用されるアルゴリズムを知りたいです。また、これはどのように行われますか?
3 に答える
オブジェクト検出を行うには多くの方法があり、それはまだ未解決の問題です。
テンプレート マッチングから始めることができます。これは、新しい画像 (IB) で既知の画像 (IA) との畳み込みを行うことで構成される、おそらく最も簡単な解決方法です。ビデオに示されているように、信号にフィルターを適用するようなものなので、フィルターはオブジェクトを見つけると画像内に最大点を生成するため、かなり単純なアイデアです。しかし、この手法にはいくつかの短所があり、スケールや回転のバリアントを処理しないため、実際の用途はありません。
また、さまざまなオブジェクトの SIFT、SURF、ORB などの機能を備えたデータセットを作成することで構成される、より堅牢な機能マッチングの別のオプションを見つけることができます。これにより、SVM をトレーニングしてオブジェクトを認識することができます。
変形可能なパーツ モデルも確認できます。ただし、最先端のオブジェクト検出は、Faster R-CNN、Alexnet などのディープ ラーニングに基づいており、オブジェクトの検出/認識に使用される機能を学習します。
私は Sid Farkus に同意します。この質問に対する簡単な答えはありません。
Open Computer Vision Libraryをチェックすることから始めることができるかもしれません。オブジェクト検出に関する Wiki ページがあり、ハウツーや論文へのリンクがあります。
他の例やアプローチ (つまり、アルゴリズム) が見つかるかもしれません。アルゴリズムはアプリケーションによって異なる可能性があります (つまり、実際に検出したいものによって異なります)。
これはほとんど答えられる質問ではありませんが、ほとんどのコンピューター ビジョン アプリケーションでは、適切な出発点はハフ変換です。