私はFFTと信号処理に慣れていないので、この質問が理にかなっているか、愚かではないことを願っています。
ライブオーディオ信号のスペクトル分析を実行したいと思います。私の目標は、応答性と周波数分解能の間の適切なトレードオフを見つけて、着信オーディオのピッチをほぼリアルタイムで推測できるようにすることです。
フーリエ変換の背後にある数学について私が集めたものから、サンプルサイズと周波数分解能の間には固有のバランスがあります。サンプルが大きいほど、解像度は高くなります。サンプルサイズを最小化しようとしているので(ほぼリアルタイムの要件を達成するため)、これは解像度が低下することを意味します(出力バッファーの各スロットは広い周波数範囲に対応します。これは望ましくありません)。
ただし、意図したアプリケーションでは、ほとんどのスペクトルを気にしません。狭い周波数範囲、たとえば100hz〜1600hzのスペクトル情報のみが必要です。入力バッファサイズを一定(および小さい)に保ちながら、周波数領域出力の解像度を向上させることができるように、FFT実装を変更する方法はありますか?つまり、出力の合計帯域幅を出力解像度と交換できますか?もしそうなら、これはどのように行われますか?
私はせいぜい数学の理解が弱いですが、入力バッファをゼロで埋めることは興味深いかもしれませんね。
あなたが提供できるどんな助けにも前もって感謝します。