.NETで音声認識を実装するにはどうすればよいですか?
私は.mp3
比較的高品質のコンピューター生成音声を備えたたくさんのを持っています。それぞれ.mp3
の声で、いくつかのランダムなテキストと、英語で6〜7桁のシーケンスを言います。それらの数字をテキストとして抽出したいと思います。
そのようなことを.NETに実装することは可能ですか?
.NETで音声認識を実装するにはどうすればよいですか?
私は.mp3
比較的高品質のコンピューター生成音声を備えたたくさんのを持っています。それぞれ.mp3
の声で、いくつかのランダムなテキストと、英語で6〜7桁のシーケンスを言います。それらの数字をテキストとして抽出したいと思います。
そのようなことを.NETに実装することは可能ですか?
これがあなたを助けるかもしれないSystem.Speech.Recognition名前空間へのリンクです。
音声認識を使用する場合、Windows Vista または Windows 7 で作業するのが最善です。これらには Microsoft SAPI (Speech API) 5.3 (およびまもなく 5.4 が導入される予定) があり、Windows XP の SAPI 5.1 と比較してパフォーマンスに大きな違いがあります。
さて、ここにビデオとソース コード (C++ ですが、別の言語に渡すことができます) があり、ほぼ目的のアプリケーションを実行できます。
より良い方法で単語を認識するために、認識したい単語を含む文法ファイルを作成します。あなたはそのビデオを見ることができ、あなたが望むものを非常に簡単に作ることができることがわかるでしょう.
幸運を!
MicrosoftSpeechを使用してエンジンにテキストを送信できます。使いやすい
ここにいくつかのサンプル
Microsoft SAPI SDKを使用できます:http:
//www.microsoft.com/downloads/details.aspx?
FamilyID = 5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang = en SAPI SDKのC#の例を確認してください。