マイクに話しかける代わりに、.wavsを与えるレコグナイザーをプログラムでトレーニングすることは可能ですか?
もしそうなら、それを行う方法は?、現在私は0.wavファイルのオーディオで認識を実行し、認識されたテキストをコンソールに書き込むコードを持っています。
Imports System.IO
Imports System.Speech.Recognition
Imports System.Speech.AudioFormat
Namespace SampleRecognition
Class Program
Shared completed As Boolean
Public Shared Sub Main(ByVal args As String())
Using recognizer As New SpeechRecognitionEngine()
Dim dictation As Grammar = New DictationGrammar()
dictation.Name = "Dictation Grammar"
recognizer.LoadGrammar(dictation)
' Configure the input to the recognizer.
recognizer.SetInputToWaveFile("C:\Users\ME\v02\0.wav")
' Attach event handlers for the results of recognition.
AddHandler recognizer.SpeechRecognized, AddressOf recognizer_SpeechRecognized
AddHandler recognizer.RecognizeCompleted, AddressOf recognizer_RecognizeCompleted
' Perform recognition on the entire file.
Console.WriteLine("Starting asynchronous recognition...")
completed = False
recognizer.RecognizeAsync()
' Keep the console window open.
While Not completed
Console.ReadLine()
End While
Console.WriteLine("Done.")
End Using
Console.WriteLine()
Console.WriteLine("Press any key to exit...")
Console.ReadKey()
End Sub
' Handle the SpeechRecognized event.
Private Shared Sub recognizer_SpeechRecognized(ByVal sender As Object, ByVal e As SpeechRecognizedEventArgs)
If e.Result IsNot Nothing AndAlso e.Result.Text IsNot Nothing Then
Console.WriteLine(" Recognized text = {0}", e.Result.Text)
Else
Console.WriteLine(" Recognized text not available.")
End If
End Sub
' Handle the RecognizeCompleted event.
Private Shared Sub recognizer_RecognizeCompleted(ByVal sender As Object, ByVal e As RecognizeCompletedEventArgs)
If e.[Error] IsNot Nothing Then
Console.WriteLine(" Error encountered, {0}: {1}", e.[Error].[GetType]().Name, e.[Error].Message)
End If
If e.Cancelled Then
Console.WriteLine(" Operation cancelled.")
End If
If e.InputStreamEnded Then
Console.WriteLine(" End of stream encountered.")
End If
completed = True
End Sub
End Class
End Namespace
編集
トレーニングウィザードを使用すると、これを行うのに役立つことを理解しています
音声認識を開き、[スタート]ボタン->[コントロールパネル]->[アクセスのしやすさ]->[音声認識]をクリックして実行します
。
カスタムwavまたはmp3ファイルで音声認識をカスタムトレーニングする方法は?
トレーニングウィザード(コントロールパネルトレーニングUI)を使用する場合、トレーニングファイルは {AppData} \ Local \ Microsoft \ Speech \ Files\TrainingAudioに保存されます。
トレーニングウィザードを使用する代わりに、カスタムトレーニングを使用または作成するにはどうすればよいですか?
音声コントロールパネルは、キーHKCU \ Software \ Microsoft \ Speech \ RecoProfiles \ Tokens {ProfileGUID} {00000000-0000-0000-0000-0000000000000000}\Filesにトレーニングオーディオファイルのレジストリエントリを作成します
コードによって作成されたレジストリエントリをそこに配置する必要がありますか?
これを行う理由は、自分のwavファイルと単語やフレーズのリストを使用してカスタムトレーニングを行い、すべてを他のシステムに転送したいからです。