0

私はスピーチでプログラムの感情認識を行っています。

mfcc + K-mean + GMM を使用すると、-15012、-43400、-8000 のような尤度が得られました

それは私よりもはるかに大きな価値でした。適正値ですか?

Wave ファイルの長さは通常 2 ~ 3 で、以下のオプションを使用して初期化します。

MFCC option 
SampleRate = 16000 
WindowSize = 256 
NumberCoefficients = 13
UseFirstCoefficient = true 
MinFreq = 20.0 
MaxFreq = 16000.0 
NumberFilters = 25 
K-Means Clustering default option 
NumberCluster = 2
4

1 に答える 1

1

尤度の実際の値は、特徴抽出中に使用される多くのパラメーターによって異なります。たとえば、filterbank は別の方法で作成される場合があります。これらはエンジンによって異なります。したがって、値を見ただけでは、それらが正しいかどうかはわかりません。

エンジンについて言及していないので、この質問に答えることはできません。

于 2012-09-13T08:33:46.453 に答える