1

音声認識に関するプロジェクトがあります。ライブラリ「sndfile.h」を使ったのですが、入力音の読み込みに行き詰まります。質問があります。関数によって読み取られたデータsf_readf_float()は時間領域の信号ですね。そうでない場合、それは何ですか?それを時間領域信号に変換する式はありますか?

4

1 に答える 1

0

はい、libsndfile が返すデータは時間領域データ、つまり入力ファイルからのオーディオ サンプルです。この関数sf_readf_floatはサンプルを「フレーム」で返します。1 つのフレームは、特定の時点での各チャネルからのサンプルのセットです。また、sf_readf_floatサンプルを [-1.0, 1.0] の範囲にスケーリングします。詳細については、「 」を参照this noteしてください。

libsndfile を使用してサウンド ファイルを読み取るコードの例については、 sndfile-toolsを参照してください。sndfile-mix-to-mono の例は、良い出発点になるはずです。

于 2013-07-07T09:30:25.503 に答える