Snack Sound Toolkit の例を見ると、dbPowerSpectrum 関数があるようです。
参照から:
dBPowerSpectrum ( )
(開始オプションで指定されたサンプル番号で) サウンドの対数 FFT パワー スペクトルを計算し、dB 値のリストを返します。残りのオプションの説明については、セクション項目を参照してください。オプションで、end オプションを使用して終了点を指定できます。この場合、結果は指定された範囲内の連続する FFT の平均です。デフォルトの間隔は fftlength から取得されますが、これはスキップ オプションを使用して変更できます。スキップ オプションは、各ステップで FFT ウィンドウを移動するポイントの数を示します。オプション:
編集:振幅と言うときは、時間領域の電圧ではなく、音が人間にどのように「大きく」見えるかを意味していると思います(正弦波の積分が0になるため、おそらく全長で0になります. 例: 10 * sin(t) は 5 * sin(t) よりも音量が大きくなりますが、時間の経過に伴う平均値は 0 です (いずれにせよ、AC 以外の電圧をスピーカーに送りたくはありません)。
音の大きさを知るには、各周波数成分の振幅を決定する必要があります。これは、サウンドをその周波数成分に分解するフーリエ変換 (FFT) で行われます。dbPowerSpectrum 関数は、各周波数の大きさのリストを提供するようです (これがパワー スペクトルの正確な定義と異なる場合はご容赦ください)。総音量を取得するには、リスト全体を合計するだけです (人間の耳には周波数応答自体があるため、知覚される音量とは異なる場合がありますが、これは近い値になります)。