これに関する多くの記事を読みましたが、どうすればよいのかわかりません。
MFCC 機能を HMM に使用して、基本的な音声認識システムを構築しようとしています。ここで入手できるデータを使用しています。これを行うためにMatlabを使用しています。
これまでのところ、このライブラリを使用して音声ファイルから MFCC ベクトルを抽出しました。私が理解していないのは、HMM でこれらの機能をどのように使用するかです。
HMM のトレーニング方法を教えてください。私は、matlab にある hmm 実装を使用しています。うーんの仕組みを実際に理解しようとしているので、他のライブラリを紹介しないでください。
遷移行列と放出行列を初期化するにはどうすればよいですか?
それぞれの状態が単語の特定の音素を発すると仮定しています。では、HMM をトレーニングするには、どのように MFCC ベクトルを渡せばよいのでしょうか?
HMM をトレーニングするにはどのような手順を踏む必要がありますか?
HMM の matlab 実装関数をここに示します。
編集: 長い時間が経ちましたが、ヒットしたビューの量によって質問がまだ関連していると思います。コードは私の GitHub で見つけることができます。