音声認識に関するプロジェクトがあります。ライブラリ「sndfile.h」を使ったのですが、入力音の読み込みに行き詰まります。質問があります。関数によって読み取られたデータsf_readf_float()
は時間領域の信号ですね。そうでない場合、それは何ですか?それを時間領域信号に変換する式はありますか?
質問する
669 次
1 に答える
0
はい、libsndfile が返すデータは時間領域データ、つまり入力ファイルからのオーディオ サンプルです。この関数sf_readf_float
はサンプルを「フレーム」で返します。1 つのフレームは、特定の時点での各チャネルからのサンプルのセットです。また、sf_readf_float
サンプルを [-1.0, 1.0] の範囲にスケーリングします。詳細については、「 」を参照this note
してください。
libsndfile を使用してサウンド ファイルを読み取るコードの例については、 sndfile-toolsを参照してください。sndfile-mix-to-mono の例は、良い出発点になるはずです。
于 2013-07-07T09:30:25.503 に答える