2

テレフォニー アプリケーションを Pocket Sphinx 音声認識エンジンと統合しようとしています。私が取得する記録されたファイルの種類は次のとおりです。

Input File     : '5555_9911848379__15-10-14-17-36_.wav'
Channels       : 1
Sample Rate    : 11025
Precision      : 8-bit
Duration       : 00:00:03.99 = 44000 samples ~ 299.32 CDDA sectors
File Size      : 44.0k
Bit Rate       : 88.3k
Sample Encoding: 8-bit Unsigned Integer PCM

ただし、ここにあるサンプル プログラムhttp://cmusphinx.sourceforge.net/wiki/tutorialpocketsphinx は、16000 HZ でサンプリングされた 16 ビット PCM オーディオを想定しています。

上記の記録されたファイルをデコードする方法はありますか。または、上記の形式を 16 ビット形式に変換する必要がありますか?

4

1 に答える 1

0

上記の記録されたファイルをデコードする方法はありますか。

いいえ、16 ビットが必要です

または、上記の形式を 16 ビット形式に変換する必要がありますか?

情報はすでに失われているため、変換は役に立ちません。16ビット録音が必要です。

オーディオを適切な形式で録音していることを確認する必要があります。

于 2013-10-15T12:02:19.590 に答える