0

PyBrain を使用して単純な 1 桁の分類子を実装しようとしています。0 から 9 までの数字の記録された多くの例のトレーニング データがあり、各例の MFCC を抽出するスクリプトを作成しました。簡単にするために (今のところ) 13 個の係数のみを計算し、10ms ごとに 1 回オーディオ ファイルをサンプリングしています。記録されたトレーニング例はそれぞれ持続時間が異なるため、たとえば、すべて「ゼロ」のセットのサンプル数は、音声の長さに応じてそれぞれ変化します。したがって、「ゼロ」のいくつかの例では、形状 (67,13) の MFCC トレーニング ベクトルがありますが、他の例では (44, 13) になる可能性があります。

問題は、PyBrain でデータセットを作成する場合、入力ベクトルの次元が均一である必要があり、列と同じ数の行が含まれている必要があることです。

入力ベクトルが設定された列数(13 個の MFCC)を持つようにデータセットを定義する方法はありますか? それとも私はこれを完全に間違っていますか?

オンラインとスタックオーバーフローで検索して検索しましたが、答えがわかりません。チュートリアルの Pybrain の例に従って、実装することができます。

4

1 に答える 1

0

ああ。明らかに、特定の桁のすべてのベクトルを使用して多次元確率密度関数を推定する必要があります。

于 2012-10-05T10:23:42.097 に答える