概念的な問題があります。ジェスチャー認識に Kinect を使用するプログラムを作成しています。カテゴリ (円、スワイプなど) に分けられたジェスチャ データがあります。今のところ、私は片手だけを分析しています。全コマ(30fps)を記録しています。
(*) データを離散化して位置に依存しないようにするために、連続する点間の角度を計算します。
hidden Markov models
ここで、ジェスチャーの種類ごとに作成したいと思います。
次に、 の状態の数を決定する必要がありますHMM
。どうやってするか?(時間的に)最も長いジェスチャーを見つけることを考えました。1,2s
たとえば、 first 、 second 1,4s
、 thirdの 3 つのジェスチャがあり1,5s
ます。最長1,5s
も同様です。ここで、250 ミリ秒ごとに各フレームに (*) を適用します (1 秒内に 4 つのサンプル)。私の最長のジェスチャーは1,5s
長いのでNumberOfStatesForHMM = 1500ms / 250ms = 6 states
、これはかなり最適なはずですか?
の状態をどのように定義すればよいかわからないHMM
:/ 上記の考えが正しければ、(たとえば) 6 つの状態があり、1 つのジェスチャが の後1s
に終了する場合の遷移確率をカウントする方法は、4 つの状態 (状態からの遷移の確率) を分析します。 4 から 5 と 5 から 6 は 0 に等しいか?)。
この論文を読みましたが、問題の解決方法がよくわかりません...