Windows 音声認識を使用するアプリケーションを作成しています。私はこの言語の経験があるので、これを行うために c++ を使用することを考えています。音声認識を使用したいのは、内部で機能するようにすることです。オーディオ ファイルをプログラムにアップロードする場合、音声認識でこのオーディオをテキスト ファイルとして書き出す必要がありますが、これはすべて内部で行う必要があります。質問を適切に説明していない場合はお知らせください。もう一度説明します。
前もってありがとう、Divs
Windows 音声認識を使用するアプリケーションを作成しています。私はこの言語の経験があるので、これを行うために c++ を使用することを考えています。音声認識を使用したいのは、内部で機能するようにすることです。オーディオ ファイルをプログラムにアップロードする場合、音声認識でこのオーディオをテキスト ファイルとして書き出す必要がありますが、これはすべて内部で行う必要があります。質問を適切に説明していない場合はお知らせください。もう一度説明します。
前もってありがとう、Divs
(古い質問ですが、受け入れられた回答はなく、Googleでかなり高く表示されます)
本当に C++ でこれを行いたい場合は、SAPI SDK をダウンロードする必要があります。これは、Windows には標準で付属していません: http://www.microsoft.com/downloads/en/details.aspx?FamilyID=5e86ec97-40a7- 453f-b0ee-6583171b4530&displaylang=enで、SpeechSDK51.exe を選択します。
SAPI で見つけることができる最高のドキュメントは Web ではなく、SDK 自体の Docs/ フォルダーにあります。.chm はすべてを非常によく説明しています。開始するための追加のリンクを次に示します。
ただし、C++ は必須ではありません。C# で行うことを強くお勧めします。それは本当にはるかに簡単です (COM コンポーネントなし、個別の SDK なし、MSDN のドキュメントの増加、チュートリアルの増加など)。この CodeProject の記事を参照してください。すべての GUI 要素とすべての音声合成要素を削除する必要があります。音声認識は 10 行のコードに要約されます。すごく印象的。
コンパイルされていない、テストされていないサンプルコードを編集します。
using System.Speech;
using System.Speech.Recognition;
// in constructor or initialisation
SpeechRecognitionEngine recognizer = null;
recognizer = new SpeechRecognitionEngine();
recognizer.SetInputToDefaultAudioDevice();
recognizer.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(recognizer_SpeechRecognized);
recognizer.RecognizeAsync(RecognizeMode.Multiple);
// The callback called when a sentence is recognized
private void recognizer_SpeechRecognized(object sender, SpeechRecognizedEventArgs e){
string text = e.Result.Text;
// Do whatever you want with 'text' now
}
やった、やった
Windows は、クライアントとサーバーの両方に音声認識エンジンを提供します。どちらも C++ または .NET 言語でプログラミングできます。C++ でプログラミングするための従来の API は、SAPI として知られています。クライアントとサーバーの音声用の .NET Framework ネームスペースは、System.Speech と Microsoft.Speech です。
SAPI ドキュメント - http://msdn.microsoft.com/en-us/library/ms723627(VS.85).aspx
クライアント認識用の .NET 名前空間は System.Speech - http://msdn.microsoft.com/en-us/library/system.speech.recognition.aspxです。Windows Vista および 7 には音声認識エンジンが含まれています。
サーバー認識用の .NET 名前空間は Microsoft.Speech で、10.2 バージョンの完全な SDK はhttp://www.microsoft.com/downloads/en/details.aspx?FamilyID=1b1604d3-4f66-4241-9a21-で入手できます。 90a294a5c9a4 . 音声エンジンは無料でダウンロードできます。
以前の多くの質問がこれに対処しています。例については、音声認識とSAPIに基づくプロトタイプと Windows 7 の問題を参照してください。