0

オーディオの音色を取得したい。

これを使用するために、Mel FrequencyCepstrumCoefficientsアルゴリズムを作成します。

実装は単純に見えます(私はすでにステップ1を作成しました):1。信号(のウィンドウ化された抜粋)のフーリエ変換を行います。2.三角形の重なり合うウィンドウを使用して、上記で取得したスペクトルのパワーをメル尺度にマッピングします。3.各メル周波数でのパワーのログを取ります。4.信号であるかのように、メルログパワーのリストの離散コサイン変換を行います。5. MFCCは、結果のスペクトルの振幅です。

ステップ2では、周波数からメル尺度に渡す方法を知っていますが、その三角形の重なり合うウィンドウが何を意味するのかわかりません。

この手順を正しく行うにはどうすればよいですか?三角形の重なり合うウィンドウはどういう意味ですか?

4

1 に答える 1

0

メル スケールへの変換が完了したら、このスケールに沿って等間隔に配置された一連のオーバーラップする三角フィルターを適用します (したがって、低周波数ではより狭い間隔で配置されます)。つまり、ここでは、FFT によって返されたほぼ連続した曲線から、20 ~ 50 個の離散値のセットに移行します。

私はフィルターの写真をグーグルで検索し、ここここ(p. 4) でいくつか (両方とも pdf) を見つけました。これらは、計算方法の他の詳細についてもある程度説明しています。

于 2009-10-26T02:31:53.817 に答える