私はPythonでオーディオ分析を行っています。私の最終目標は、 のような周波数とそれぞれのボリュームのリストを取得することです{ frequency : volume (0.0 - 1.0) }
。
と の間の値を持つフレームのリストとしてオーディオ データが-1.0
あり+1.0
ます。このリストで numpy のフーリエ変換を使用しました — numpy.fftpack.fft()
. しかし、結果のデータは私には意味がありません。
フーリエ変換が時間領域から周波数領域に変換されることは理解していますが、数学的にどのように機能するかはわかりません。そのため、結果がよくわかりません。
numpy.fftpack.fft()
返されるリストの値は何を意味しますか? それをどのように扱う/解釈するのですか?- 上記のようにリストに対して実行されるフーリエ変換の最大値/最小値は何でしょうか?
- 形式で辞書の最終目標を達成するにはどうすればよい
{ frequency : volume (0.0 - 1.0) }
ですか?
ありがとうございました。フーリエ変換についての私の理解が不足していて、あなたが顔をしかめた場合は申し訳ありません。