単純な音声パターンを認識するプロジェクトに取り組んでいます。2 つのデータ セットがあり、それぞれが 4 ~ 32 の音符/デュレーションのペアで構成されています。1 つのセットは事前定義されており、もう 1 つは着信データ ストリームからのものです。強く相関する 2 つのデータ セットの長さは異なることがよくありますが、ほぼ同じ "形状" です。私の目標は、2 つのデータセットがどの程度相関/一致しているかについて、何らかのランキングを作成することです。
入力周波数をピッチに変換し、入力データ ストリームのピッチをシフトして、平均ピッチが事前定義されたデータ セットのピッチと一致するようにしました。また、事前定義されたセットの全体的な持続時間と一致するように、着信データ セットの持続時間を伸縮します。強い相関があるとしてランク付けする必要があるデータの 2 つのグラフの例を次に示します。
http://s2.postimage.org/FVeG0-ee3c23ecc094a55b15e538c3a0d83dd5.gif
(申し訳ありませんが、新しいユーザーとして、画像を直接投稿できませんでした)
リソースが最小限になるように、8 ビットのマイクロコントローラーでこれを行っています。速度はさほど問題ではなく、1 秒か 2 秒の処理が問題になることはありません。
明らかな解決策があったとしても、私は驚かないでしょう。私は問題をあまりにも長く見つめていました。何か案は?
前もって感謝します...