1

Viola-Jonesオブジェクト検出フレームワーク(ViolaとJonesによるロバストなリアルタイム顔検出)について説明している論文では、次のように述べられています。

トレーニングに使用されたすべてのサブウィンドウの例は、さまざまな照明条件の影響を最小限に抑えるために分散正規化されています。

私の質問は「Octaveで画像の正規化を実装する方法」です。

Viola&Jonesが使用した特定の実装を探しているのではなく、ほぼ同じ出力を生成する同様の実装を探しています。私は多くのhaar-trainingチュートリアル(手を検出しようとしている)に従ってきましたが、まだ良い検出器(xml)を出力することができません。

著者に連絡しようとしましたが、まだ応答がありません。

4

1 に答える 1

2

このスレッドの一般的なガイドラインで、その方法についてはすでに回答しました。

オクターブで方法1(標準正規偏差に正規化)を行う方法は次のとおりです(ランダム行列のデモンストレーションは、Aもちろん、画像の表現方法である任意の行列に適用できます)。

>>A = rand(5,5)
A =

   0.078558   0.856690   0.077673   0.038482   0.125593
   0.272183   0.091885   0.495691   0.313981   0.198931
   0.287203   0.779104   0.301254   0.118286   0.252514
   0.508187   0.893055   0.797877   0.668184   0.402121
   0.319055   0.245784   0.324384   0.519099   0.352954

>>s = std(A(:))
s =  0.25628
>>u = mean(A(:))
u =  0.37275
>>A_norn = (A - u) / s
A_norn =

  -1.147939   1.888350  -1.151395  -1.304320  -0.964411
  -0.392411  -1.095939   0.479722  -0.229316  -0.678241
  -0.333804   1.585607  -0.278976  -0.992922  -0.469159
   0.528481   2.030247   1.658861   1.152795   0.114610
  -0.209517  -0.495419  -0.188723   0.571062  -0.077241

上記では、以下を使用します。

  • 行列の標準偏差を取得するには:s = std(A(:))
  • 行列の平均値を取得するには:u = mean(A(:))
  • そしてA'[i][j] = (A[i][j] - u)/s、ベクトル化されたバージョンで式に従います。A_norm = (A - u) / s

ベクトル正規化で正規化することも簡単です。

>>abs = sqrt((A(:))' * (A(:)))
abs =  2.2472
>>A_norm = A / abs
A_norm =

   0.034959   0.381229   0.034565   0.017124   0.055889
   0.121122   0.040889   0.220583   0.139722   0.088525
   0.127806   0.346703   0.134059   0.052637   0.112369
   0.226144   0.397411   0.355057   0.297343   0.178945
   0.141980   0.109375   0.144351   0.231000   0.157065

上記で:

  • absはベクトルの絶対値(その長さ)であり、ベクトル化された乗算で計算されます(A(:)' * A(:)実際にはsum(A[i][j]^2)
  • 次に、これを使用してベクトルを正規化し、長さが1になるようにします。
于 2012-12-18T13:26:31.347 に答える