1

Microsoft C# API は、オーディオ ストリームを認識するための SpeechRecognitionEngine を提供します。認識をテストする 1 つの方法は、メソッドSpeechRecognizer.EmulateRecognizeを呼び出すことです。

ドキュメントによると:

recognizers ignore case and character width when applying 
grammar rules to the input phrase

スペルミスのあるテキストでも信頼性が非常に低いため、よりあいまいな文字列を処理する方法があるかどうかを知りたいです! 実生活とはほど遠い...

  • 音声があれば、自信を持って Hello、Hello、Hello と言うことができました
  • テキストを使用すると、エンジンは非常に厳密です

編集:何の目的で?

私の音声エンジンは正常に動作していますが、テキスト入力からもトリガーしたいと考えています。

携帯電話で HTML5 SpeechRecognition を使用するとします。認識したテキストをエンジンに送信して、音声と同じ動作を得たい

4

3 に答える 3

0

オーディオをレコグナイザーに送信すると、SR エンジンは多くの処理を実行して、一連の音素を作成し (音響モデリングを介して)、次に一連の文字列を作成します (音素モデリングを介して)。その過程で、あいまいさの多くが解消されます。EmulateRecognizeSR エンジンを介して処理されるオーディオを生成しません。すべてのモデリングをスキップし、文字列の一致のみを行います。

多くの作業を必要とせずにこれを回避する方法はありません (たとえばEmulateRecognize.

于 2013-09-05T23:26:34.563 に答える