8

Viola-Jones オブジェクト検出フレームワーク (Viola と Jones によるロバスト リアルタイム顔検出)について説明している彼らの論文では、次のように述べられています。

トレーニングに使用されるサブウィンドウの例はすべて、さまざまな照明条件の影響を最小限に抑えるために分散が正規化されています。

私の質問は、「画像を正規化するためにどのようなツールを使用したのですか?」です。

Viola & Jones が使用した特定のツールを探しているのではなく、ほぼ同じ出力を生成する同様のツールを探しています。私は多くのhaar-trainingチュートリアル(手を検出しようとしています)に従ってきましたが、まだ良い検出器(xml)を出力できません。

作者に連絡してみましたが、まだ返事がありません。

4

1 に答える 1

5

考えられる方法の 1 つは、すべての要素に正規分布を仮定して単純で単純な正規化を適用することです。

最初に平均 (Mu) と標準偏差(S)を見つけます。

Mu = 1/N * Sum(a[i][j]) for each i,j 
S  =  sqrt(1/(N-1) *  Sum((a[i][j] - Mu)^2)) for each i,j
       (in here N is the number of pixels, 20*20 in the viola jones case)

これから、標準正規分布式を使用して各ピクセルの値を正規化できます (すべての値を標準化することにより)。

a'[i][j] = (a[i][j] - Mu) / S

もう 1 つの方法はベクトルの正規化で、基本的には次のようになります。

  • ベクトルの長さを求めます。|a| = sqrt(sum (a[i][j]*a[i][j])) for each i,j
  • 割当:a'[i][j] = a[i][j] / |a|
于 2012-12-12T08:41:57.367 に答える