2

動物のサウンドクリップを識別できるアプリケーションを開発しようとしています。私がやっていることは、AMR記録を取り込んで、そこからバイト配列を読み取り、FFTを介してそれらのデータを送信し、それに応じて振幅を計算することです。

AMRファイルのサンプル周波数8KHz(15秒の標準AMR)

8192個の値を入力するためのFFTポイントの数4096

次に、振幅を振幅= 2*FFTポイント値/8192で計算します。

したがって、私の意図は、最大振幅に関連する周波数でスパイクを取得することです。問題は、最大振幅でのスパイクが、同じ動物の他のサウンドクリップに対して一貫していないことです。別のサウンドクリップの場合、最大振幅に関連する周波数が変化します。これには理由がありますか?これに関するヘルプとガイダンスをいただければ幸いです。前もって感謝します。

4

1 に答える 1

1

ファイルのサンプル周波数は8KHzですが、人間の平均聴力周波数は20KHzだと思います。したがって、サンプルのナイキスト周波数を尊重していると思います(.wavファイルのサンプルレートは通常少なくとも48KHzです)。 )?

ナイキスト周波数は、特定の信号をサンプリングする場合は、特定の信号の最大周波数の少なくとも2倍のサンプル周波数を使用する必要があることを示しています。

また、同じ動物が異なる音を出す可能性があり、また鳴る可能性があるため、2つの異なるサンプルの平均周波数が同じになることはありません。さまざまな平均頻度を考慮した許容しきい値がありますか?

于 2011-12-26T13:23:22.050 に答える