画像内の動物を検出するために、カスケード分類子をトレーニングしています。残念ながら、私の偽陽性率は非常に高いです (Haar と LBP を使用すると非常に高く、HOG を使用すると許容範囲内です)。分類子をどのように改善できるか疑問に思っています。
ここに私の質問があります:
- 堅牢な検出に必要なトレーニング サンプルの量は? 4000 pos と 800 neg のサンプルが必要だとどこかで読んだことがあります。それは良い見積もりですか?
- トレーニング サンプルはどの程度異なるべきか? 可能な「重複」データを含める/除外するために、画像の違いを定量化する方法はありますか?
- 遮られたオブジェクトをどのように処理すればよいですか? 動物の目に見える部分だけを訓練するべきですか、それとも平均 ROI がかなり一定になるように ROI を選ぶべきですか?
- re occluded objects: 動物には足、腕、尻尾、頭などがあります。一部の体の部分は頻繁に隠れる傾向があるため、ROI として「胴体」を選択するのは理にかなっていますか?
- 画像を縮小して小さい画像サイズでトレーニングする必要がありますか? これはおそらく物事を改善できますか?
私はここでどんな指針にもオープンです!