最近、顔認証について少し調べてみました。しかし、アルゴリズムの数の多さに圧倒されます。
PCA、LDA、IDA、ガボール ウェーブレット、AAM ...
このようなものを作りたいとします...どのアルゴリズムを使用しますか、またはどの論文を読みますか?
最近、顔認証について少し調べてみました。しかし、アルゴリズムの数の多さに圧倒されます。
PCA、LDA、IDA、ガボール ウェーブレット、AAM ...
このようなものを作りたいとします...どのアルゴリズムを使用しますか、またはどの論文を読みますか?
最初にすべきことは、リストしたアルゴリズムが顔認識のさまざまな段階で使用されることを理解することだと思います.
まず、表現、つまり使用する機能を決定する必要があります。これらは、生のピクセル、ガボール フィルター、ある種の形状記述子、変形可能なモデルなどです。
次に、通常、フィーチャの次元を削減します。ここで、PCA、ICA、または LDA などのアルゴリズムが登場します。これらのアルゴリズムは、データ ポイントを低次元空間に射影し、ほとんどの分散を維持しようとする (PCA) か、異なるカテゴリのポイントの最適な分離を確保しようとします (LDA)。
次に、さまざまな人の顔を区別するために、特徴で分類子をトレーニングする必要があるでしょう。Nearest Neighbor、Support Vector Machines、Hidden Markov Models、Bayes Nets など、多数のアルゴリズムから選択できます。
特定のステージのアルゴリズムの選択は、他のステージのアルゴリズムに依存する場合と依存しない場合があることに注意してください。たとえば、PCA を使用して、ほぼすべてのタイプのフィーチャの次元を削減できます。一方、変形可能なメッシュで表現された顔にサポート ベクター マシン分類器をどのように使用できるかは、すぐにはわかりません。
最初にすべきことは、問題を非常に正確に定義することだと思います。写真で家族を認識するなど、数人の顔だけを区別したいですか?巨大なデータベースから人を認識したいですか? 顔ごとにたくさんのトレーニング画像がありますか、それとも少数ですか? さまざまな向きや照明条件を処理したいですか?
これらの質問に対する答えは、問題の複雑さを決定し、アルゴリズムの選択に確実に影響します。
編集:これは、同様の問題を解決しようとした誰かの論文です。2002年からですが、私見は始めるのに良い場所です.
深度マップを検討したい。それが最先端です。まばらな球面表現について読んでみてください。固有面はあまり堅牢ではありません。いくつかの要因に対して不変ではありません。最先端の顔認識は、深度情報を持つ 3d PCL を使用しています。これにより、暗闇でも認識できるようになります。Asus カメラまたは Kinect カメラを使用して深度情報を収集できます。それが役立つことを願っています!
マリレナ港で走るハールカスケード。
Haarカスケードは、ファイルを読み取り、コンピューターに何かがどのように見えるかを伝えるアルゴリズムです。私は過去にそれを使って顔、眼鏡、ただの笑顔、手、そしてコークス缶を検出しました。