1

音声認識には Kinect + Microsoft.Speech を使用しています。

入力オーディオ ストリームを取得するには、次の手順を実行する必要があります。

Stream kinectAudioStream = myKinect.AudioSource.Start();

音声認識を開始します

speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new   SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);

私の目標は、入力信号をリアルタイムで (オシロスコープのように) 視覚化し、同時に音声認識を行うことです。

複数のスレッドでMicrosoft の「 AudioBasics-WPF C# Sample 」に音声認識を追加するなど、いくつか試してみました。それは機能しますが、レイテンシーは非常に非常に悪いです。音声認識と視覚化の多くの中断に。

パフォーマンスを上げる方法はありますか?誰かアイデアはありますか?

4

1 に答える 1