1

私は、非常に乱雑なビデオで顔を検出する必要があるプロジェクトに取り組んでいます (自己中心的な視点から記録されているので、想像できます..)。顔には、-90 から +90 の間で変化するヨー角度、ほぼ同じ変化 (人間の身体の制約により少し低い..) のピッチ、および場合によってはいくつかのロール変化もある可能性があります。

ポーズに依存しない顔検出器を探すのに多くの時間を費やしました。私のプロジェクトでは OpenCV を使用していますが、OpenCV の顔検出器は必要な検出率にさえ近づいていません。正面の顔では非常に良い結果が得られますが、横顔ではほとんど結果が得られません。プロファイル画像でトレーニングされた haarcascade .xml ファイルを使用しても、実際には役に立ちません。正面カスケードとプロファイル カスケードを組み合わせると、わずかに良い結果が得られますが、それでも、私が必要としているものにはほど遠いものです。

私自身のハーカスケードのトレーニングは、膨大な計算 (または時間) の要件があるため、私の最後のリソースになります。

今のところ、私が求めているのは、この問題に関する助けやアドバイスです。私が使用できる顔検出器の要件は次のとおりです。

  • 非常に良い検出率。誤検知率が非常に高いことは気にしません。ビデオで一時的な一貫性を使用することで、おそらくそれらの大部分を取り除くことができるからです。
  • c++ で書かれたもの、または c++ アプリケーションで動作するもの

リアルタイムは今のところ問題ではありません。今は検出率がすべてです。

これらの結果を達成している多くの論文を見てきましたが、使用できるコードが見つかりませんでした。

何卒よろしくお願い申し上げます。

4

1 に答える 1

1

おそらく答えではありませんが、コメントするには長すぎます。

opencv_traincascade.exe を使用して、さまざまなポーズを検出できる新しい検出器をトレーニングできます。この投稿が役立つ場合があります。http://note.sonots.com/SciSoftware/haartraining.html . 私はフェレット データ セットを使用して、-50:+50 ヨーイング内で敏感な検出器を訓練することに成功しました。私の場合、純粋に横顔を検出したくはなかったので、それに応じてトレーニング データが準備されました。feret はすでに便利なポーズのバリエーションを提供しているため、仕様に多少近い検出器をトレーニングできる可能性があります。lbp 機能を使用している場合、時間は問題ではありません。トレーニングはせいぜい 4 ~ 5 時間で完了し、適切なパラメーターを設定し、使用するトレーニング データを減らすことでさらに速くなります (15 ~ 30 分)。期待どおりの出力を生成します)。

于 2013-08-05T05:51:20.660 に答える