1

基になる状態が同じであるが、観測が時間的にリンクされていない場合に、2 つの HMM を 1 つにマージする良い方法があるかどうかを理解しようとしています。

同じ隠れ状態空間を記述する 2 つの独立した観測ストリームがあります。各観測ストリームの基本的な順序は変わりませんが、同時に出力されることはありません。

たとえば、2 人の別々のスピーカーがテキストの同じパッセージを声に出して読んでいるオーディオ録音があるとします。この場合、隠れ状態空間がテキストの文字になり、各オーディオからの音素の流れが観測空間を構成します。各スピーカーは音声を別々に録音し、読むときに異なるリズムを使用します。

各話者を個別に使用してテキストの予測を明確に行い、事後に結果を調整することはできます...しかし、観測ストリームを単一の HMM に結合すると、より良い結果が得られる可能性があると感じています。

これを調整する良い方法を知っている人はいますか?

4

2 に答える 2

1

状態をマージするには、最初にこれらのストリームを調整する必要があります...つまり、ある種の対数尤度最適化。しかし、複数のストリームからの統計を使用して「観測」を予測することは可能です。最新のデータコンプレッサーは基本的にそれを実行します。例えば。http://www.mattmahoney.net/dc/dce.html#Section_432を参照してください

于 2011-02-12T18:44:32.463 に答える
0

2 つの HMM をそれぞれ異なる観測シーケンスに適合させた後にマージする方法があるかどうかはわかりません。

しかし、複数の独立した観測シーケンスで 1 つのマルコフ モデルをトレーニングするアルゴリズムが存在します。

たとえば、ラビナーによる論文「隠れマルコフモデルと音声認識における選択されたアプリケーションへのチュートリアル」でカバーされています

残念ながら、このアルゴリズムの実装はまだ見つかっていません。

これがstackexchangeに関する私の対応する質問です: https://stats.stackexchange.com/questions/53256/two-sequences-one-hmm

于 2013-03-27T19:51:56.177 に答える