1

私は LVQ を学習したばかりで、mfcc (メル周波数ケプストラム係数) の結果を使用して実装したいと考えています。私が知る限り、私が研究したすべての例には、次のような均一なトレーニングと入力データサイズの配列があります。

x1[2][4] = {{0,1,1,1},{1,1,1,1},[{1,1,0,1}}

x2[2][4] = {{0,1,1,0},{1,1,0,1},{1,0,0,1}}

x3[2][4] = {{1,0,1,0},{1,1,1,0},{0,0,0,1}}

しかし、私のmfcc結果のデータサイズは次のように不均衡です:

x1 1 [4] = {{0,1,1,1},{1,1,1,1}}

x2[2][4] = {{0,0,1,0},{1,1,0,1},{1,0,0,1}}

x2[4][4] = {{0,0,1,0},{1,1,0,1},{1,0,0,1},{0,1,1,1},{ 1,0,1,0}}

では、LVQ トレーニングと入力用のこの不均衡なデータ サイズをどのように処理すればよいでしょうか?

4

1 に答える 1

0

この問題で試す最も基本的なことは、欠損値を 0 成分で埋めることです。あなたのメル周波数ケプストラム係数は基本的にフーリエ変換なので、2番目のフーリエ変換です。これは効果がないはずです。

入力ベクトルの最大サイズを見つけてみてください。次に、次元が欠落している他の小さな入力ベクトルを 0 で埋めます。以下のように。

x1[1][4] = {{0,1,1,1},{1,1,1,1},,{0,0,0,0},{0,0,0,0}, {0,0,0,0}}

x2[2][4] = {{0,0,1,0},{1,1,0,1},{1,0,0,1},{0,0,0,0},{ 0,0,0,0}}

x2[4][4] = {{0,0,1,0},{1,1,0,1},{1,0,0,1},{0,1,1,1},{ 1,0,1,0}}

于 2016-02-09T18:30:14.310 に答える