WinampやWindowsMediaPlayerで見られるように、オーディオデータでFFTを使用してアナライザーを出力しています。ただし、出力はそれほど見栄えがよくありません。対数目盛を使用してプロットしており、FFTからの線形結果を対応する対数ビンに平均化します。例として、私は次のようなビンを使用しています。
16k、8k、4k、2k、1k、500、250、125、62、31、15 [hz]
次に、周波数[hz]に対して振幅(dB)をプロットします。グラフは間違いなく音楽に「反応」し、ドラムサンプルや高音の声の反応を見ることができます。ただし、グラフは低周波数に非常に「飽和」しており、全体的には、より均等に分散される傾向があるアプリケーションで見られるものとはあまり似ていません。視覚的な出力を表示するアプリは、データの見栄えを良くするためにデータに対してさまざまなことを行う傾向があると思います。
データを一般的な音楽プレーヤーアプリのように見せるために、データにどのようなことができますか?
いくつかの有用な情報:私はシングルチャネル、32kHzにダウンサンプリングし、35msの時間ウィンドウを指定します。これは、FFTが最大1100ポイントを獲得することを意味します。これらの値を実験のために変更します(つまり、16kHzを試し、間隔の長さを増減します)が、同様の結果が得られます。