周波数が異なるウェーブファイル間で類似したパターンを特定する必要があるプロジェクトに取り組んでいます。
たとえば、人間の音声周波数は互いに異なります。人間が泣いているかどうか、声の笑い声を叫んでいるかどうかを確認する場合は、頻度に関係なく、泣いている声の間にパターンがあるはずです。
したがって、これらの要素を識別できるアルゴリズムを探しています。
Neural Networksを見ることから始めることができます。これらのタイプのプログラムは、通常、データの特定の不整合をうまく処理します。Neuroph Studioは、ニューラル ネットワークを構築するための迅速で比較的簡単な方法を提供します。
必要なのは、照合したいものを含む一連のデータだけです。このデータの約 70% を使用して、ニューラル ネットワークにデータのクラスター化を学習させ、残りの 30% を使用してニューラル ネットワークをテストできます。
ニューラル ネットワークの主な問題は、データを入力ベクトルにエンコードする方法を見つける必要があることです。これを行うと、ニューラル ネットワークは独自に違いを見つけようと学習するはずです。
画像ベースの認識では、主成分分析とその兄弟であるカーネル PCA や線形判別分析が適切です。PCAはどんなデータにも効くアルゴリズムなので、音にも当てはまると思います。
wav を int-Vectors に変換し、PCA を実行して機能を抽出します。
JMathToolsはそのために非常に優れています...
これも見つけた...
お役に立てれば幸いです...