私は現在、最後にDCTを実行せずにMFCC機能を使用してcnnをトレーニングする論文の作品を複製しようとしています。これは基本的に、フィルター バンクのエネルギーの対数です。
kaldi は make_mfcc.sh スクリプトを使用して MFCC 機能を計算できることを知っています。しかし、スクリプトを変更して、最後に DCT を実行せずに MFCC を計算することはできますか?
MFCC は、一般的に次のように導出されます。
信号 (ウィンドウ処理された抜粋) のフーリエ変換を行います。
- 上で取得したスペクトルのパワーを、三角形のオーバーラップ ウィンドウを使用してメル スケールにマッピングします。
- 各メル周波数でのパワーの対数を取ります。
- あたかも信号であるかのように、メル ログ ベキのリストの離散コサイン変換を取ります。
- MFCC は、結果として得られるスペクトルの振幅です。