だから私は機械学習を学んでいて、mfcc 機能サイズが RNN (Recurent Neural Network) にどのように影響するか知りたいと思っていましたか?
librosa を使用して、mfcc を抽出し、次にデルタ係数を抽出した後、次元 [13, sound_length] の配列を取得します。
Python で mfcc とデルタ係数を抽出するコード: (y - サウンド ファイル データ、sr - y の長さ)
mfcc = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)
mfcc_delta = librosa.feature.delta(mfcc, axis=0, order=1)
したがって、理論的には、この種のデータと n_mfcc=39 のデータを使用してネットワークをトレーニングしたい場合。誰がより良いでしょうか、そしてその理由は何ですか? (他のすべてのハイパー パラメーターは無視します) このパラメーターが RNN にどのように影響するかについての理論を知りたいだけです。