手書き認識など、ユーザーが描いた一連の点を分類することを学習できるアプリケーションを作成したいと思います。データ ポイントが多数の (x,y) ペア (ジェスチャ インスタンスに対応するピクセルなど) で構成される場合、インスタンスについて計算するのに最適な特徴は何ですか。 NNなど)?特に、提供されているトレーニング例が限られている場合。
1 に答える
私があなたなら、角、終点、交点に対応するデータ ポイントを見つけて、それらを特徴として使用し、中間点を破棄します。これらの関心点の角度またはその他の記述子も含めることができます。
Harris 検出器を使用できる関心点を検出するには、その時点での勾配値を単純な記述子として使用できます。または、 SIFTなどのより凝った方法を使用することもできます。
ダウンサンプリングされた画像のすべてのピクセルの記述子を使用して、SVM で分類できます。その欠点は、特徴ベクトルに大量の興味のないデータ ポイントが存在することです。
別の方法は、分類の問題としてではなく、テンプレート マッチングの問題としてアプローチすることです (コンピューター ビジョンではかなり一般的です)。この場合、ジェスチャは任意の数の関心点として指定でき、関心のないデータは完全に除外されます。肯定的な識別のためには、インスタンスのポイントの特定のしきい値パーセンテージがテンプレートと一致する必要があります。たとえば、「R」のインスタンスのコーナー ポイントを「X」のテンプレートと一致させる場合、右下のポイントは一致し、同じ位置方向のエンド ポイントになりますが、他のポイントはあまりにも似ていないため、かなり低いスコアと識別 R=X は拒否されます。