1

私は現在、最後にDCTを実行せずにMFCC機能を使用してcnnをトレーニングする論文の作品を複製しようとしています。これは基本的に、フィルター バンクのエネルギーの対数です。

kaldi は make_mfcc.sh スクリプトを使用して MFCC 機能を計算できることを知っています。しかし、スクリプトを変更して、最後に DCT を実行せずに MFCC を計算することはできますか?

MFCC は、一般的に次のように導出されます。

信号 (ウィンドウ処理された抜粋) のフーリエ変換を行います。

  1. 上で取得したスペクトルのパワーを、三角形のオーバーラップ ウィンドウを使用してメル スケールにマッピングします。
  2. 各メル周波数でのパワーの対数を取ります。
  3. あたかも信号であるかのように、メル ログ ベキのリストの離散コサイン変換を取ります。
  4. MFCC は、結果として得られるスペクトルの振幅です。
4

1 に答える 1