6

トレーニングサンプルを作成しようとしています(その後、分類器をトレーニングします)。createsamplesとtraincascadeで使用されるパラメータ-hとパラメータについて混乱しています。-w私が見ている例では、通常、これらに小さな値を使用していますが、トレーニング画像(負および正)は、通常、画像の75〜100%を占めるようにトレーニングしているオブジェクトを使用すると、かなり大きくなります(480x640)。これらのパラメータは画像のサイズ(画像から単純に引き出すことができます)を求めていないようですが、画像内のオブジェクトのサイズも求めていないのではないかと思います。推測する必要がある場合(そして私が推測したくない場合)、サイズを大きくすると検出精度が向上する可能性がありますが、トレーニング中の計算負荷が増加します。

誰かがこれらのパラメータが実際に何を意味するのか説明できますか?私が見たほとんどの例では、デフォルトの24x24以上の40x40を使用していますが、私が見る限り、これより高くなることはありません。

4

1 に答える 1

8

これらの小さな画像値は、分類子をトレーニングする対象のポジティブ (オブジェクト) です。カスケード分類器は画像のさまざまなスケールで機能するため、実際のフレーム内のオブジェクトは任意のサイズになる可能性があります。

これは、独自の分類器をトレーニングするときに役立つ優れたチュートリアルです。トレーニングに使用されるトリミングされた画像はサイズが大きくなる可能性がありますが、実行時にcreatesamplesはポジティブ テクスチャがスケーリングされるサイズを指定する必要があります。これらの新しい小さなサンプルは、分類器に使用されるサンプルです。これは、カスケード分類器の速度にも影響します。そのため、通常はサイズが小さいのです。

私が間違っていなければ、背景画像のサイズが大きくなる可能性がありますが、まだ持っていた背景画像を小さな断片にトリミングしていたことを覚えています。

実際の 640x480 データを使用して分類器を実行する場合、正の最小サイズの制限 (もちろん、この値は少なくとも前に指定した -w -h のサイズである必要があります) と予想される最大サイズを指定します。

haar 検出器は、テスト イメージ内の必要な大きさのウィンドウ範囲内でのみオブジェクトを検索します。

于 2013-02-28T15:01:20.940 に答える