私は、音声認識のためにメル周波数ケプストラム係数 (MFCC) を実装する必要があるアプリケーションに取り組んでいます。
MFCC の最初のステップは、プリエンファシスを適用することです
プリエンファシスは、より高い周波数で信号のエネルギーを増加させます。低周波帯域は、音声認識にとって役に立たない/有害な音で占められているためです。
このプロセスの次の方程式を見つけました。
Y[n]=X[n]−0.95⋅X[n−1]
私の質問は、元の信号にこの式を適用するだけでいいですか?? そのため、より高い周波数で信号のエネルギーが増加します。または、この方程式を適用する前に、入力信号に特定のフィルターを適用する必要がありますか? もしそうなら、どのようにプログラムしますか?