音声認識のシステムを作りたいです。訓練を受けたシステムは、同様の音を認識できる必要があります。たとえば、シャワー、トイレの水洗、火災報知器などの音はほとんどありません。システムをフラットに設置して、それらの音でトレーニングします。そうすれば、システムは、シャワー、水洗トイレ、火災警報器の音のスペクトルがわずかに異なるさまざまなアパートに設置されたときに、これらの音を認識できるはずです。それは可能ですか?どのようなテクニックを使用できますか? 隠れマルコフ モデルやニューラル ネットワークなどの音声認識技術について考えていました。
2427 次
4 に答える
0
FFTはあなたの友達です。この記事では、いくつかのトラックを紹介します。
于 2012-04-23T09:40:21.473 に答える
0
ニューラル ネットワークでこれを行うことに興味がある場合は、まずニューラル ネットワークに関する文献を読むことをお勧めします。また、ニューラル ネットワークによる音声認識に関するいくつかの役立つメモは、こちらにあります。
基本的に、これはこのリンクからダウンロードできるソフトウェアのユーザー ガイドです。
私はこのソフトウェアを自分で使用したことはありませんが、ソース コードも提供されていると思います。それが役立つことを願っています。
編集: ニューラル ネットワークにバックプロパゲーション アルゴリズムを実装する Code Project のソース コードもいくつか追加しました。こちらをご覧ください
于 2012-04-23T09:39:21.650 に答える
0
上記のパターン認識/機械学習ソリューションに加えて、おそらくDynamic Time Warpingも検討する必要があります。
于 2012-04-24T00:02:20.090 に答える