4

私の最終論文では、色と深度の情報を組み合わせて3D顔認識システムを構築しようとしています。私が行った最初のステップは、反復最接近点アルゴリズムを使用して、データヘッドを特定のモデルヘッドに再調整することです。検出ステップでは、libsvmの使用を考えていました。しかし、深さと色の情報を1つの特徴ベクトルに組み合わせる方法がわかりませんか?それらは依存情報です(各ポイントは色(RGB)、深度情報、およびスキャン品質で構成されています)。何をすることをお勧めしますか?重み付けのようなものですか?

編集:昨夜、SURF / SIFT機能に関する記事を読みました。それらを使用したいと思います!それはうまくいくでしょうか?コンセプトは次のようになります。各特徴をsvmの単一の特徴ベクトルとして使用して、カラー画像と深度画像(範囲画像)からこの特徴を抽出しますか?

4

4 に答える 4

4

連結は確かに可能です。ただし、3D 顔認識に取り組んでいるため、それをどのように行うかについて何らかの戦略を立てる必要があります。顔の回転と平行移動は、「単純な」アプローチでは認識しにくいでしょう。

顔全体の検出を実行するか、サブ機能の検出を実行するかを決定する必要があります。いくつかのコア機能 (目、鼻など) を見つけることで、回転を検出しようとすることができます。

また、SVM は本質的にバイナリであること (つまり、2 つのクラスに分かれていること) を覚えておいてください。正確なアプリケーションによっては、いくつかのマルチクラス戦略 (1 対 1 または 1 対多) を採用する必要がある可能性が非常に高くなります。

文献調査を行って、他の人がこの問題にどのように取り組んでいるかを確認することをお勧めします (Google 検索が良い出発点になります)。

于 2010-11-29T15:30:33.217 に答える
1

単純に聞こえますが、単純に 2 つのベクトルを 1 つに連結することができます。多くの研究者がこれを行っています。

于 2010-11-29T15:00:16.170 に答える
0

他の人が述べたように、最も簡単なアプローチは、2 つの機能セットを 1 つに単純に結合することです。

SVM は、最大マージン超平面の法線によって特徴付けられます。ここで、そのコンポーネントは特徴の重み/重要性を指定し、絶対値が高いほど決定関数に大きな影響を与えます。したがって、SVM は各機能に独自に重みを割り当てます。

これが機能するためには、明らかに、すべての属性を正規化して同じスケールにする必要があります (たとえば、すべてのフィーチャを [-1,1] または [0,1] の範囲に変換します)。

于 2010-11-30T00:51:32.450 に答える
0

あなたがたどり着いたのは重要な未解決の問題です。はい、Eamorr がここで述べたように、それを処理する方法がいくつかあります。たとえば、連結してPCA(または非線形次元削減法)を実行できます。しかし、PCA が機能の数で O(n^3) 時間かかることを考えると、そうすることの実用性を擁護するのはちょっと難しいです。これだけでも、何千もの特徴を持つ可能性のあるビジョン内のデータには不合理かもしれません。

于 2010-11-29T23:26:13.200 に答える