テレフォニー アプリケーションを Pocket Sphinx 音声認識エンジンと統合しようとしています。私が取得する記録されたファイルの種類は次のとおりです。
Input File : '5555_9911848379__15-10-14-17-36_.wav'
Channels : 1
Sample Rate : 11025
Precision : 8-bit
Duration : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors
File Size : 44.0k
Bit Rate : 88.3k
Sample Encoding: 8-bit Unsigned Integer PCM
ただし、ここにあるサンプル プログラムhttp://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx は、16000 HZ でサンプリングされた 16 ビット PCM オーディオを想定しています。
上記の記録されたファイルをデコードする方法はありますか。または、上記の形式を 16 ビット形式に変換する必要がありますか?