fft を使用して、読み込まれた 1 秒の音声ファイルの周波数、位相、大きさを取得し、「ああ」と言って再作成することができます。私が今やろうとしているのは、これらの各周波数が 1 秒のオーディオ ファイルのどこで始まり、どこで終わるかを調べ、データを配列に配置することです。
例: 100hz は 0.23 秒から 0.34 秒で始まり、104.34hz は 0.35 秒で始まり 0.37 秒で終わります。
fft はこれを行うことができますか、それともウェーブレットを使用するようにプログラム全体をシフトする必要がありますか? また、私が達成しようとしていることを行う方法を示すオクターブのウェーブレットの例はありますか?
レポのUbuntu Linux 12.04とOctave 3.2.4を使用しています
ありがとうリック