machine-learning - ジェスチャ認識の機能

Question

手書き認識など、ユーザーが描いた一連の点を分類することを学習できるアプリケーションを作成したいと思います。データポイントが多数の (x,y) ペア (ジェスチャインスタンスに対応するピクセルなど) で構成される場合、インスタンスについて計算するのに最適な特徴は何ですか。 NNなど）？特に、提供されているトレーニング例が限られている場合。

score 1 · Accepted Answer

私があなたなら、角、終点、交点に対応するデータポイントを見つけて、それらを特徴として使用し、中間点を破棄します。これらの関心点の角度またはその他の記述子も含めることができます。

Harris 検出器を使用できる関心点を検出するには、その時点での勾配値を単純な記述子として使用できます。または、 SIFTなどのより凝った方法を使用することもできます。

ダウンサンプリングされた画像のすべてのピクセルの記述子を使用して、SVM で分類できます。その欠点は、特徴ベクトルに大量の興味のないデータポイントが存在することです。

別の方法は、分類の問題としてではなく、テンプレートマッチングの問題としてアプローチすることです (コンピュータービジョンではかなり一般的です)。この場合、ジェスチャは任意の数の関心点として指定でき、関心のないデータは完全に除外されます。肯定的な識別のためには、インスタンスのポイントの特定のしきい値パーセンテージがテンプレートと一致する必要があります。たとえば、「R」のインスタンスのコーナーポイントを「X」のテンプレートと一致させる場合、右下のポイントは一致し、同じ位置方向のエンドポイントになりますが、他のポイントはあまりにも似ていないため、かなり低いスコアと識別 R=X は拒否されます。

machine-learning - ジェスチャ認識の機能

1 に答える 1

Related

Reference