1

私はオーディオ処理に非常に慣れていません。ですので、無知なことをお許しください。

ウィキペディアによると、通常、x 軸は時間を表し、y 軸は周波数を表すか、その逆です。色の濃さは、特定の時間と周波数における振幅 (エネルギー) を表します。これは簡単に理解できます。

specgrampylab API から生成されたスペクトログラムを解釈できません。

スペックグラムサンプル

上の図は、それぞれ異なるウィンドウ サイズ (128、512、1024) のスペクグラムをプロットしています。x軸が周波数であることは明らかです。Y 軸の 0 から 1.0 までの値は何を表していますか?

誰かがこれに光を当てることができれば、本当に感謝しています。

4

1 に答える 1

3

画像と、波形プロットとスペクトログラムの相関関係から、x 軸が周波数であると推測するのは誤りです。

x 軸は時間です。私はそれがサンプルで測定されていると推測します。スペクトログラムの x​​ ラベルが時間領域プロットの半分である理由は不明です。

色付きのスペクトログラム プロットの y 軸は周波数であり、おそらく 0 からナイキスト (半分のサンプリング レート) に正規化されています。たとえば、8000Hz のサンプリング レートを想定すると、y 軸は [0.0, 1.0] -> [0.0Hz, 4000Hz]

于 2013-09-05T06:15:04.527 に答える