speech-recognition - Microsoft Speech Platform - サンプリングレートとビット深度

翻译自：https://stackoverflow.com/questions/18142501 2013-08-09T08:07:46.170

680 次

音声のサンプリングレートとビット深度がシステムのトレーニングデータと一致する場合、認識結果は最適になります。

では、Microsoft Speech Platform で使用されている正確なサンプリングレートやビット深度 (および/またはステレオ/モノラル) を知っている人はいますか? もしそうなら、どこでこの情報を入手したか覚えていますか?

SAPI ではなく、MS Speech Platform を使用していることに注意してください。両方が同じトレーニングデータを使用していない限り、それは同じではありません。正確に言うと - 私はこれを使用します :

私の最初の試みは、ページにある C++ コードの例に基づいています。

speech-recognition - Microsoft Speech Platform - サンプリング レートとビット深度