4

私は現在、音声認識を使用したディスカッション フェーズのプロジェクトに参加しています。MFCC 特徴抽出を使用していますが、関数から返される MFCC 特徴は行列です。各音声ファイル (wav) の (20,38) 特徴行列。しかし、どうすればこの機能を SVM 分類器に渡すことができますか。SVM (およびその他の分類子) の場合、各サンプルはベクトルで表されますよね? ただし、各サンプルの MFCC 機能はマトリックスです。Xi がサンプル i の MFCC 機能であると仮定すると、SVM に渡されるサンプル i の機能は次のとおりです。1) 20*38 ベクトル。Matlab 形式の Xi(:)。2) 平均 (Xi)。3) Xi の列または行の 1 つ。どの方法が正しいですか?このための有用なコード、紙はありますか?

ありがとう!輝く

4

1 に答える 1

6

音声認識などのシーケンスタグ付けタスクでは、SVMだけでなく、SVMとHMMの組み合わせを使用する必要があります

  1. 特徴マトリックスをGMM-HMMの状態に合わせ、各HMM状態に対応する特徴を取得します
  2. 各状態に属する機能についてSVMをトレーニングする
  3. GMM-HMMの代わりにSVM-HMMを実装する

詳細については、

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

高速にするには、次のような既存のツールキットを使用します。

http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html

于 2013-03-02T07:26:15.167 に答える