「HelloWorld」という言葉で自分の声を録音し、file-1として保存します。
次に、「Hello World」を使用して別の男の声を録音し、ファイル2として保存します。
これらの2つのファイルを一致させる方法はありますか?
つまり、2つのファイルに同じ単語が記録されている場合、それらは等しくなければなりません。
読むべきオープンソースプロジェクトや論文を教えてください。
「HelloWorld」という言葉で自分の声を録音し、file-1として保存します。
次に、「Hello World」を使用して別の男の声を録音し、ファイル2として保存します。
これらの2つのファイルを一致させる方法はありますか?
つまり、2つのファイルに同じ単語が記録されている場合、それらは等しくなければなりません。
読むべきオープンソースプロジェクトや論文を教えてください。
動的タイムワーピングアルゴリズムを試してみてください
これは、アプライアンスでDTWアルゴリズムを使用して音声認識を行う例ですhttp://www.cnel.ufl.edu/~kkale/6825Project.html