1

音声認識を C# と統合できますか? 私たちの方言を認識するアプリケーションを開発したいと思っています。スピーカーに依存しないようにするために、まだオーディオファイルを収集しています。

  1. どのモデルを使用すればよいですか? 言語か音響か?
  2. どのツールをお勧めしますか?
4

3 に答える 3

1

音声認識システムを作成することは非常に複雑なトピックであり、このテーマについて多くの論文が書かれています。ここにいくつかの素晴らしい紹介論文があります:

  1. http://www.speech-recognition.de/pdf/introSR.pdf
  2. http://www.cs.columbia.edu/~mcollins/6864/slides/asr.pdf
  3. http://www.cs.rochester.edu/u/james/CSC248/Lec12.pdf

上記の論文は、スペクトル モデリング、特徴ベクトル抽出、クラスタリング、およびデータ マッピングの基本を扱っていますが、このような複雑な分類問題に対する私のお気に入りのアプローチは、常にニューラル ネットワーク ベースでした。以下は、さまざまな NN ベースのアプローチを扱った一連の論文です。

  1. http://www.cslu.ogi.edu/tutordemos/nnet_recog/recog.html
  2. http://www.ll.mit.edu/publications/journal/pdf/vol01_no1/1.1.7.neuralnetworks.pdf
  3. http://www.ru.lv/~peter/zinatne/ebooks/(Brain%20Study)_Speech%20Recognition%20using%20Neural%20Networks.pdf
  4. http://www.cs.toronto.edu/~ruiyan/csc411/ANNSpeechRecognition.pdf

小さく始めて、少しずつシステムを構築することをお勧めします。幸運を!

好奇心から - どの言語をサポートする必要がありますか?

于 2012-08-02T16:21:51.273 に答える
1

あなたはこの記事で試すことができます、それはとてもいいです

http://www.c-sharpcorner.com/uploadfile/ssrinivas/speeechrecognitionusingcsharp11222005054918am/speeechrecognitionusingcsharp.aspx

于 2012-08-02T15:53:43.493 に答える
1

Microsoft Speech APIを試しましたか? MSDN には、C# 入門チュートリアルが含まれています。

于 2012-08-02T15:51:56.543 に答える