0

MFCC係数の抽出に成功し、以下の値を取得しました

  -15.2366
    6.4996
   -2.1807
    0.2495
   -1.3403
    0.9815
   -0.1106
    1.7914
    0.7311
    1.1881
    1.3340
    2.6080
    1.4208
    2.0144
    0.5085
   -1.1236
   -1.2728
   -0.9470
   -0.8139
    0.8987
    1.6006
    1.6000
    0.4638
    0.3747
    0.0670
   -0.0620
    0.6234
    0.0614
    0.0964
    0.2334
   -0.2188
    0.0591
    0.6765
    0.3943
   -0.1409
    0.1894
    0.0004
   -0.4762
   -0.1273
    0.1655
   -0.0649
   -0.2606
    0.0075
   -0.1275
   -0.2038
   -0.1332
    0.2084
    0.5128
    0.8877
    0.5406

次に、これらの値から機能を抽出する方法を説明します。ありがとうございました

4

1 に答える 1

0

MFCC は、既に認識エンジン (通常は HMM) をトレーニングするために使用する必要がある機能です。

しかし、それらの特徴をどのように抽出したのでしょうか? 典型的な MFCC は N 行 M 列の行列のように見えるため、ベクトルは、扱っているオーディオ ファイル内の単一の 100 ミリ秒ウィンドウの MFCC を表していると思います。N は特徴の抽出に使用したウィンドウの数で、M は MFCC の抽出方法によって異なります (通常は M=39)。

于 2014-03-19T10:24:07.470 に答える