8

iOS アプリに 1 ユーロ、2 ユーロ、0.50 ユーロのコインを認識させるために、独自の classifier.xmlを使用opencv_createsamplesして作成しようとしています。opencv_traincascadeそこで、次のような短いビデオから 2 ユーロ硬貨の画像を 60 枚切り抜きました。

ここに画像の説明を入力

次に、 を使用してそれらをランダムな背景と組み合わせましたopencv_createsamples。これに似た12000枚の画像を取得しました:

ここに画像の説明を入力

次のコマンドを実行しました。

opencv_createsamples -img positives/i.jpg -bg negatives.txt -info i.txt -num 210 -maxidev 100 -maxxangle 0.0 -maxyangle 0.0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 -w 48 -h 48(i は 0 から 60 まで)

cat *.txt > positives.txt

opencv_createsamples -info positives.txt -bg negatives.txt -vec 2.vec -num 12600 -w 48 -h 48

opencv_traincascade -data final -vec 2.vec -bg negatives.txt -numPos 12000 -numNeg 3000 -numStages 20 -featureType LBP -precalcValBufSize 2048 -precalcIdxBufSize 2048 -minHitRate 0.999 -maxFalseAlarmRate 0.5 -w 48 -h 48

トレーニングは13段階で停止しました。取得したら、スマートフォンで撮影した単純な画像cascade.xmlですぐに試してみましたが、何も検出されませんでした:detectMultiScale()

ここに画像の説明を入力

一方、トレーニングとして使用される画像の 1 つを入力として与えると、非常にうまく機能します。

ここに画像の説明を入力

なぜこれが起こっているのか本当に理解できず、気が狂ってしまいます。何よりも、何週間も機能させようとしてきたからです...どこで間違いを犯しているのか教えていただけますか?

私が書いた短いプログラムは次のとおりです。

#include "opencv2/opencv.hpp"

using namespace cv;

int main(int, char**) {

Mat src = imread("2b.jpg");

Mat src_gray;

std::vector<cv::Rect> money;

CascadeClassifier euro2_cascade;

cvtColor(src, src_gray, CV_BGR2GRAY );
equalizeHist(src_gray, src_gray);

if ( !euro2_cascade.load( "cascade.xml" ) ) {
    printf("--(!)Error loading\n");
    return -1;
}

euro2_cascade.detectMultiScale( src_gray, money, 1.1, 3, 0|CASCADE_SCALE_IMAGE/*CV_HAAR_FIND_BIGGEST_OBJECT | CV_HAAR_SCALE_IMAGE*/, cv::Size(10, 10),cv::Size(2000, 2000) );
printf("%d\n", int(money.size()));

for( size_t i = 0; i < money.size(); i++ ) {
    cv::Point center( money[i].x + money[i].width*0.5, money[i].y + money[i].height*0.5 );
    ellipse( src, center, cv::Size( money[i].width*0.5, money[i].height*0.5), 0, 0, 360, Scalar( 255, 0, 255 ), 4, 8, 0 );
}

namedWindow( "Display window", WINDOW_AUTOSIZE );
imwrite("result.jpg",src);
}

また、OpenCV バージョン 3.1 の機能ホモグラフィーを考慮に入れようとしました。したがって、自分のバージョン用に opencv_contrib をダウンロードし、xfeatures2d モジュールをコンパイルしようとしましたが、CMakeList ファイルで CMake エラーが発生しました...さらに、xfeature2d は xcode の opencv フレームワーク内にも存在しないため、自分の PC で動作させたとしても、とにかくiOSでは使用しないでください...

アップデート

アドバイスどおり、削除しようとしたところequalizeHist(src_gray, src_gray);、detectMultiScale()`` で近隣の数を設定したところ、次のようになりました。

ここに画像の説明を入力

更新 2

誰かが示唆したように、このチュートリアルに従って、トリミングされた正の画像、コインのみの画像のみを使用して.vecファイルを作成しました。私はこのコマンドを使用しました:

opencv_createsamples -vec i.vec -w 48 -h 48 -num 210 -img ./positives/i.jpg -maxidev 100 -maxxangle 0 -maxyangle 0 -maxzangle 0.9 -bgcolor 0 -bgthresh 0 (i は 0 から 60 まで)

ご覧のとおり、サンプルを作成するために使用される背景画像はありません。次に、mergevec.pyをダウンロードした後、すべてのベクター ファイルを結合しました。今、私は別のLBPトレーニングを開始するつもりです...うまくいくことを願っています

4

2 に答える 2