3

ハールカスケード法では、マスクサイズが一定で、画像内の顔のさまざまなサイズを考慮して、元の画像を縮小および拡大してオーバーラップを見つけるかどうか疑問に思っていました。

畳み込みニューラル ネットワークでは、重み行列のサイズが 20*20 で一定であることがわかりました。

これとは別に、haar cascade と CNN のどちらが顔検出に適しているかを知りたいです。その場合は、haar cascade を使用して最初に顔の位置を検出し、さらに CNN を使用して顔を認識することができます。

Ps :-face は単なるオブジェクトです。車や木など、他のものでもかまいません.....

4

1 に答える 1

4

まだ読んでいない場合は、元のViola/Jones 論文を読んでください。ご覧のとおり、haar フィーチャのサイズ変更/形状変更について特定の戦略はありません。しかし、それは理にかなっており、あなたが疑う理由のためにそれを行うべきです. それを行うための「1つの方法」はありませんので、先に進んでいくつかのアイデアを試してください.

フレームワークは弱分類器が何であるかを指定しないため、トレーニング速度について適切なステートメントを作成することはできません。私が言えるのは、haar-cascade-classifier は 3 層の異なるアルゴリズムがあるため、時間がかかるということだけです。しかし、なぜそれが重要なのかわかりません。トレーニング速度は常に遅いです。それが CNN に関する問題である場合、あなたのコンセプトには欠陥があります。

ヴィオラ・ジョーンズのフレームワークはかなり「完全」です。まず、CNN で問題を解決できない理由を自問してから、まったく別のものにジャンプするのではなく、アプローチを改善する必要があります。私が知っている両方の方法の最も有用な組み合わせは、CNN アンサンブルです。

于 2015-07-22T08:46:40.277 に答える