1

特定の単語を識別するために、HMM (隠れマルコフ モデル) を実装したいと考えています。これまでのところ、信号の係数 (MFCC) を抽出することができましたが、HMM をトレーニングするためにこれが正しいデータであるかどうか疑問に思いましたか?

また、HMM をトレーニングするための形式 (以下) は正しいですか?

形式:

各サンプルには、一連の MFCC 係数があります。例として、これらのサンプルのうちの 2 つを提供しました...

-13.8033 0.645476 3.2174 -0.625136 -0.470134 -2.96368 0.701151 0.464246 1.1898 -1.88515 0.0805242 0.311573 0.732487

-19.4252 -5.65454 0.853437 0.317219 0.146167 -1.93742 0.381944 -2.01793 -0.561144 -0.896783 -0.105491 -1.06504 -0.797318

誰かが助けてくれることを願っています:)

4

1 に答える 1

1

2 つのアプローチを使用できます。

1 つは、連続 MFCC ベクトルを HMM の離散観測値に変換するために、これらのベクトルに対してベクトル量子化を行うことです。

その他は、連続アプローチを使用して HMM でトレーニングを実行することです。このスレッドで詳細を見ることができます:

ゼロからの簡単な音声認識

于 2014-06-20T19:33:22.857 に答える