私はオーディオ信号処理について宿題をしていました。私はいくつかの論文を読みましたが、式について混乱しています: . この式は、44100Hz、16 ビット、シングル チャネル オーディオの処理に使用されます。オーディオは前処理されており、1024 幅のフレームにスライスされています。はF(w)
各フレームの FFT 係数でw with - above
、フレーム レートの半分である 22050 です。
私は多くのことを検索しましたが、最も重要なのは高速フーリエ変換を使用してオーディオを分析するです。しかし、私はまだそれを明確に理解することはできません。1024 幅の配列である scipy と numpy を使用して、FFT 係数を取得しました。では、どのように式を実行しますか?配列の 0 ~ 512 個の値の合計に等しいか?
誰かが私を助けてくれることを願っています。前もって感謝します。