オーディオの音色を取得したい。
これを使用するために、Mel FrequencyCepstrumCoefficientsアルゴリズムを作成します。
実装は単純に見えます(私はすでにステップ1を作成しました):1。信号(のウィンドウ化された抜粋)のフーリエ変換を行います。2.三角形の重なり合うウィンドウを使用して、上記で取得したスペクトルのパワーをメル尺度にマッピングします。3.各メル周波数でのパワーのログを取ります。4.信号であるかのように、メルログパワーのリストの離散コサイン変換を行います。5. MFCCは、結果のスペクトルの振幅です。
ステップ2では、周波数からメル尺度に渡す方法を知っていますが、その三角形の重なり合うウィンドウが何を意味するのかわかりません。
この手順を正しく行うにはどうすればよいですか?三角形の重なり合うウィンドウはどういう意味ですか?