2

I'v got a binary classification problem. I'm trying to train a neural network to recognize objects from images. Currently I've about 1500 50x50 images. The question is whether extending my current training set by the same images flipped horizontally is a good idea or not? (images are not symetric)

Thanks

4

4 に答える 4

1

画像を水平に反転するだけでなく、画像の角度を 1 度変更することで、これをはるかに広範囲に行うことができると思います。これにより、トレーニング セットにあるすべてのインスタンスに対して 360 個のサンプルが得られます。アルゴリズムの速度にもよりますが、これはアルゴリズムが画像とそのミラーを認識するためだけに訓練されていないことを確認するための非常に良い方法かもしれません。

それは良い考えかもしれませんが、繰り返しになりますが、画像認識の目標やドメインが何であるかはわかりません。/画像に文字が含まれていて、画像にスラッシュが含まれているかバックスラッシュが含まれているかを画像認識ソフトウェアに判断さ\せているとします。画像を反転すると、トレーニング データが役に立たなくなります。ドメインがそのような問題に悩まされていない場合は、それらを反転させたり、さまざまな程度で回転させたりすることをお勧めします.

于 2012-08-02T15:27:01.867 に答える
1

私はコースで大成功を収めてAdaBoostで反転画像を使用しました:http://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/Schedule.php zip "TrainingImages.tar.gz"から。

スライドのどこか (ホームページ) で反転画像を使用することの長所/短所に関する情報があることは知っていますが、それを見つけることができません。また、優れたリソースはhttp://www.csc.kth.se/utbildning/kth/kurser/DD2427/bik12/DownloadMaterial/FaceLab/Manual.pdf (スライドと一緒に)です。オリエンテーション。

于 2012-08-03T13:46:57.250 に答える
0

画像のパッチが対称的でない場合は、反転するのは良い考えではないと思います。より良いアイデアは、いくつかの制限付きでトレーニングセットにいくつかの類似性変換を行うことです。データセットを増やす別の方法は、ガウス平滑化テンプレートをデータセットに追加することです。正と負のサンプルの数が比例していることを確認してください。ポジティブが多すぎてネガティブが少なすぎると、分類器が歪んで、テストセットのパフォーマンスが低下する可能性があります。

于 2012-08-08T19:30:09.720 に答える
0

それは、NN が何に基づいているかによって異なります。回転不変の特徴または画像内の空間位置に依存しない特徴 (ヒストグラムなど) を抽出し、これらの特徴を使用して NN をトレーニングする場合、回転はお勧めできません。

ピクセル値で直接トレーニングしている場合は、良い考えかもしれません。いくつかの詳細が役立つ場合があります。

于 2012-10-17T19:02:44.660 に答える