私はOpenCVが初めてなので、助けてください。OpenCVを使って唇のエッジを検出したいです。それで、いくつかのリンクと解決策を教えてもらえますか? OpenCVを使用して顔と口を検出する通常の手順を確認しましたが、精度はありません。「haarcascade_mcs_mouth」を使用して写真の口を検出しましたが、結果はあまり良くありませんでした。また、 AAM法についても聞いたが、それに関する資料は入手できなかった。私を助けてください...
1 に答える
唇の認識は、コンピュータビジョンの問題であり、完全には解決されていません。あなたが使用しているhaarのような分類器(OpenCVに含まれています)は、顔認識ではうまく機能しますが、唇認識のために、より優れた技術が開発されました。さまざまなアルゴリズムを構築し、目的に適したアルゴリズムを選択する必要があります。iOS用に開発しているという事実は、追加の制約(メモリフットプリント、CPUなど)のためにタスクを難しくします。私はあなたのために唇認識の最先端の簡単な概要を要約したので、あなたはさらに研究することができます:
唇を認識する方法は、3つの大きなカテゴリに分類できます。
画像ベースのテクニック:これらは、肌と唇の色が異なるという仮説に基づいています。論文[2]は、手話認識に適用されるこの種のアプローチの例です。カラークラスタリングも[3]によって調査されています。画像には、肌と唇の2つのピクセルクラスがあることを前提としています。この方法は、あごひげを生やしている場合や、歯を見せている場合などには適していません。
モデルベースの手法:これらの手法は、唇の形状に関する事前情報を使用するため、以前の手法よりも堅牢です。ただし、計算コストが高いため、モバイルデバイスでの実装には適さない場合があります。AAM(Active Appearance Models)はこのグループに属し、手動で注釈を付けたデータから唇の形状を学習します。ウィキペディアの記事の「外部リンク」セクションでは、C ++/OpenCVに移植できるいくつかのオープンソースの実装とライブラリを見ることができます。
ハイブリッド技術:これらの方法は、画像ベースの方法とモデルベースの方法を組み合わせたものです。通常、唇の領域の位置とサイズを推定するために、最初にカラーベースの手法が画像に適用されます。次に、モデルベースの手法(AAMなど)を対象領域に適用して、唇の輪郭を抽出します。[4]はこの手法の例です。
[2] U.CanzlerおよびT.Dziurzyk、「ビデオベースの手話認識のための非手動機能の抽出」。;MVAの議事録。2002、318-321
[3] Leung、Shu-Hung、Shi-Lin Wang、およびWing-HongLau。「楕円形関数を組み込んだファジークラスタリングを使用した唇の画像セグメンテーション。」画像処理、13.1(2004)のIEEEトランザクション:51-62。
[4]ブービエ、クリスチャン、PY。クーロン、ザビエル・マルダグ。「ROI最適化とパラメトリックモデルに基づく教師なし唇セグメンテーション。」画像処理、2007年。ICIP2007。IEEE国際会議。巻 4. IEEE、2007年。