トレーニングサンプルを作成しようとしています(その後、分類器をトレーニングします)。createsamplesとtraincascadeで使用されるパラメータ-h
とパラメータについて混乱しています。-w
私が見ている例では、通常、これらに小さな値を使用していますが、トレーニング画像(負および正)は、通常、画像の75〜100%を占めるようにトレーニングしているオブジェクトを使用すると、かなり大きくなります(480x640)。これらのパラメータは画像のサイズ(画像から単純に引き出すことができます)を求めていないようですが、画像内のオブジェクトのサイズも求めていないのではないかと思います。推測する必要がある場合(そして私が推測したくない場合)、サイズを大きくすると検出精度が向上する可能性がありますが、トレーニング中の計算負荷が増加します。
誰かがこれらのパラメータが実際に何を意味するのか説明できますか?私が見たほとんどの例では、デフォルトの24x24以上の40x40を使用していますが、私が見る限り、これより高くなることはありません。