1


こんにちは、皆さん。(この文でいいですか?)

音声(単語)認識をHTKツールでシミュレートしてみました。
そして、*.wav ファイルがあります。
サンプリング レートが 16KHz のファイルもあれば、サンプリング レートが 44.1KHz のファイルもあります。

そして、各サンプリングレートについて mfcc ファイルを作成します。
しかし、私はすべて(16KHzと44.1KHz)のmfccファイルを使ってHMMモデルを作っています。

voice_16KHz.wav -> voice_1.mfcc
voice_44.1KHz.wav -> voice_2.mfcc
make hmm_model using voice_1.mfcc and voice_2.mfcc

異なるサンプリングレートを混ぜてHMMモデルを作ってもいいですか?

提案ではなく、確実に情報を知る必要があります。

読んでくれてありがとう。

4

1 に答える 1