画像を解析して、その中の車の位置を特定することはできますか? もしそうなら、あなたはこの問題にどのように取り組みますか?
私は比較的小さなデータ セット (50 ~ 100) を使用しており、ほとんどの画像は次の例のようになります。
車の実際の形状ではなく、垂直座標のみを検出することに主に関心があります。たとえば、これは最終出力として強調したい領域です。
画像を解析して、その中の車の位置を特定することはできますか? もしそうなら、あなたはこの問題にどのように取り組みますか?
私は比較的小さなデータ セット (50 ~ 100) を使用しており、ほとんどの画像は次の例のようになります。
車の実際の形状ではなく、垂直座標のみを検出することに主に関心があります。たとえば、これは最終出力として強調したい領域です。
1) 1 番目と 2 番目の画像には 2 台の車が写っています。
2) 画像が 50 ~ 100 枚しかない場合は、それらすべてを手動で分類する方が、車を認識して座標を提供するアルゴリズムを記述または適合させるよりも高速であることをほぼ保証できます。
3) コンピューター ビジョンでこれを行うことに決めた場合は、OpenCV をお勧めします。チュートリアルはこちら: http://docs.opencv.org/doc/tutorials/tutorials.html
これは教師あり機械学習の問題です。colinsmith が提案したように、学習アルゴリズムを特徴とする API を使用するか、独自に調査して作成する必要があります。Python は機械学習に非常に優れており (私が個人的に使用しているものです)、scikit などの優れたツールがあります: http://scikit-learn.org/stable/
車を検出し、その周りにバウンディング ボックスをプロットするために、openCV の LateSVM 検出器を使用できます。
http://docs.opencv.org/modules/objdetect/doc/latent_svm.html
自動車用のトレーニング済みモデルが既にあるため、HaarCascade を使用して新しいモデルをトレーニングする必要はありません。
https://github.com/Itseez/opencv_extra/tree/master/testdata/cv/latentsvmdetector/models_VOC2007
HAAR分類子を調べることをお勧めします。50 ~ 100 枚の画像のセットがあると述べたので、これを使用して分類子のトレーニング データセットを構築し、それを使用して画像を分類できます。
指定された問題の SURF および SIFT アルゴリズムを調べることもできます。