iOS アプリに 1 ユーロ、2 ユーロ、0.50 ユーロのコインを認識させるために、独自の classifier.xmlを使用opencv_createsamples
して作成しようとしています。opencv_traincascade
そこで、次のような短いビデオから 2 ユーロ硬貨の画像を 60 枚切り抜きました。
次に、 を使用してそれらをランダムな背景と組み合わせましたopencv_createsamples
。これに似た12000枚の画像を取得しました:
次のコマンドを実行しました。
opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48
(i は 0 から 60 まで)
cat *.txt > positives.txt
opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48
opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48
トレーニングは13段階で停止しました。取得したら、スマートフォンで撮影した単純な画像cascade.xml
ですぐに試してみましたが、何も検出されませんでした:detectMultiScale()
一方、トレーニングとして使用される画像の 1 つを入力として与えると、非常にうまく機能します。
なぜこれが起こっているのか本当に理解できず、気が狂ってしまいます。何よりも、何週間も機能させようとしてきたからです...どこで間違いを犯しているのか教えていただけますか?
私が書いた短いプログラムは次のとおりです。
#include "opencv2/opencv.hpp"
using namespace cv;
int main(int, char**) {
Mat src = imread("2b.jpg");
Mat src_gray;
std::vector<cv::Rect> money;
CascadeClassifier euro2_cascade;
cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);
if ( !euro2_cascade.load( "cascade.xml" ) ) {
printf("--(!)Error loading\n");
return -1;
}
euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));
for( size_t i = 0; i < money.size(); i++ ) {
cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}
namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}
また、OpenCV バージョン 3.1 の機能ホモグラフィーを考慮に入れようとしました。したがって、自分のバージョン用に opencv_contrib をダウンロードし、xfeatures2d モジュールをコンパイルしようとしましたが、CMakeList ファイルで CMake エラーが発生しました...さらに、xfeature2d は xcode の opencv フレームワーク内にも存在しないため、自分の PC で動作させたとしても、とにかくiOSでは使用しないでください...
アップデート
アドバイスどおり、削除しようとしたところequalizeHist(src_gray, src_gray);
、detectMultiScale()`` で近隣の数を設定したところ、次のようになりました。
更新 2
誰かが示唆したように、このチュートリアルに従って、トリミングされた正の画像、コインのみの画像のみを使用して.vecファイルを作成しました。私はこのコマンドを使用しました:
opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0
(i は 0 から 60 まで)
ご覧のとおり、サンプルを作成するために使用される背景画像はありません。次に、mergevec.pyをダウンロードした後、すべてのベクター ファイルを結合しました。今、私は別のLBPトレーニングを開始するつもりです...うまくいくことを願っています