0

私はオーディオ処理の初心者です。要件を満たしています。x 秒の入力オーディオ波形は、10 ミリ秒ごとに 25 ミリ秒のハミング ウィンドウで計算された 128 次元のログ メル フィルターバンク (バンク) 機能のシーケンスに変換されます。128*100x スペクトログラムになります。

プロセスについて混乱しています。

4

0 に答える 0