私が見たすべての離散 HMM で、観測データは整数のストリームで構成されていました。しかし、観測が実際に離散的な特徴ベクトルである場合はどうなるでしょうか? たとえば、HMM を使用して、ビデオ フレームのグレースケール強度値に対するジェスチャ認識を学習しようとするとどうなりますか? つまり、各観測値は、単一の値ではなく、nxn 行列で記述されますか? どうすればこれを行うことができますか?
ありがとう!
私が見たすべての離散 HMM で、観測データは整数のストリームで構成されていました。しかし、観測が実際に離散的な特徴ベクトルである場合はどうなるでしょうか? たとえば、HMM を使用して、ビデオ フレームのグレースケール強度値に対するジェスチャ認識を学習しようとするとどうなりますか? つまり、各観測値は、単一の値ではなく、nxn 行列で記述されますか? どうすればこれを行うことができますか?
ありがとう!
使用するライブラリによっては、ObservationVectors
うまく機能する場合があります。行列を n² 次元のベクトルにフラット化し、検証済みのデータでモデルをトレーニングできます。次に、一連のベクトル観測から任意のジェスチャを検出できます。
HMM の放出成分に離散多項分布を使用できます。たとえば、各状態はn*n
、ピクセル強度 (グレースケール) を表す 0 から 255 までの値を持つ長さの整数の配列を出力します。
もちろん、値が連続している場合 (浮動小数点数)、多変量正規分布を使用してください。