さて、入力波を表す複素数のサイズ512の生の配列は、FFTで処理されると、虚数部をゼロに置き換え(使用目的に応じて)、実数部を残して、配列をサンプルレートでFFTに渡します。 :8192Hz。
これで、512個のFFT実数の配列ができました。各値は無理数であり、すべての無理数はいくつかの有用な値を表します。
基本周波数を取得するには、サンプルレートをバッファサイズで割る必要があります。
8192/512 = 32;
32はFFT値の分解能であり、32の倍数である数値の近くの高振幅周波数を知るようになっていることを意味します。
の波があるかのように
周波数:3 48 23128振幅:10 5 12 8 dB(ref = 1)
FFT後、次のようになります。
周波数:0 32 64128振幅:9 8 2 8
FFTは周波数領域であり、周波数に従って配置されます。反対側の時間領域は、音楽を聴く時間ごとに2番目の0から2番目のNまで配置されることを意味します。
FFTは、周波数0から周波数Nまでの周波数でアレンジされた場合にのみリッスンできます。
つまり、周波数を昇順で並べます。FFTにナノ秒以下を取得するように、オーディオから実際のサンプルをすべて取得するわけではないため(無限に近づいています)、幸いなことに、FFTはオーディオからサンプルを取得します。 (1 /サンプルレート)秒ごとにサンプルを取得します。このサンプルはバッファリングされ(この場合は512)、各512サンプルがFFTにバッファリングされ、出力は512FFT値になります。
FFTは周波数をアレンジするため、時間サンプルを混乱させます。サンプルは周波数に従ってアレンジされます。
サンプルレートをバッファサイズで割った基本周波数であるレギュラーベースで表示される周波数。この場合、8192/512=32です。
したがって、周波数パワーは32周波数ごとに表示され、最も近い周波数のパワーは、パワー周波数がインデックスにどれだけ近いかに応じて表示されます。
より高いサンプルレートを使用することで、高解像度を実現できます。
周波数を表示するために、振幅に対応する昇順でインデックスを印刷します。
振幅=20log10(出力/参照)
各インデックスの横に印刷された振幅は、周波数のパワーを示し、解像度の精度に応じてより正確になります。
結論として、FFTは振幅のインデックスを生成し、各振幅は対応するインデックス(周波数)のパワーを表します。