1

HMM理論について読んでいます。私が理解していることから、HMMを続けるには、初期確率、遷移確率、および放出確率が必要です。HMM の実装について私が見た例では、これらすべての確率が開始時に定義されています。しかし、問題は、HMM を使用してジェスチャを認識したいのですが、確率 (つまり、遷移確率と放出確率行列) を定義する方法を理解できていないことです。ビタビ アルゴリズムを使用して最適なシーケンスを取得する方法、または前方後方を使用して推論を取得する方法を知っています。心配しているのは開始確率だけです。

これに関して誰でも私を案内できますか?

4

2 に答える 2

4

実際、隠れマルコフ モデルには 3 つの主要なアルゴリズムがあり、あなたは 3 つのうち 2 つについて言及しました。

  1. 前方後方アルゴリズム。
  2. ビタビ アルゴリズム
  3. Baum Welch アルゴリズム: トレーニング データからパラメーター (初期確率、遷移確率、放出確率) を推測します。

Baum-Welch アルゴリズムは、基本的に期待値最大化アルゴリズムであり、ランダムな開始パラメーターから開始し、前方後方アルゴリズムを使用して、初期パラメーターの最尤値を計算し、反復します。このレクチャー ノートでは、アルゴリズムの疑似コードを使用した適切な解説が提供されています。また、HMM の非常に成功したアプリケーションである音声認識の関連問題についても説明します。残念ながら、確率が非常に小さくなるため、Baum-Welch やその他のアルゴリズムを実際に実装するのは一般的にかなり難しいという事実については説明していません。したがって、実際には、慎重なスケーリングを使用するか、対数確率を使用するか、3 つの主要な HMM アルゴリズムすべてを含む HMM の sci-kit Learn の実装を使用する必要があります。

于 2013-05-16T23:17:01.407 に答える
1

ここでは、HMM を使用してジェスチャを認識する方法についての基本的なウォークスルーである私のブログ投稿を確認できます (学部のプロジェクトを完了したときに得た経験からのものです)。必要な 3 つのアルゴリズムの基本と、最終的に関連する行列の初期確率を推定する方法と、それに続くトレーニング データと学習アルゴリズムの性質に焦点を当てています。少なくとも始めるのに役立つことを願っています。

ここで質問の一部に答えると、初期確率の推定値は実装ごとに異なる可能性がありますが、これはマルコフ モデルの性質に大きく依存します。つまり、エルゴード、LRB、 LR。これに応じて、トランジション、エミッション、および初期確率の初期値が異なる場合があります。次に、ジェスチャを認識するために、キャプチャした画像フレーム内の特定の (またはグループの) 特徴を「観察」する必要があります。同じことのより詳細な説明については、私のブログ投稿を参照することをお勧めします。

于 2013-05-29T04:17:35.980 に答える