c++ - C++ を使用して Windows 音声認識を呼び出して使用する

Question

Windows 音声認識を使用するアプリケーションを作成しています。私はこの言語の経験があるので、これを行うために c++ を使用することを考えています。音声認識を使用したいのは、内部で機能するようにすることです。オーディオファイルをプログラムにアップロードする場合、音声認識でこのオーディオをテキストファイルとして書き出す必要がありますが、これはすべて内部で行う必要があります。質問を適切に説明していない場合はお知らせください。もう一度説明します。

前もってありがとう、Divs

score 5 · Accepted Answer

（古い質問ですが、受け入れられた回答はなく、Googleでかなり高く表示されます）

本当に C++ でこれを行いたい場合は、SAPI SDK をダウンロードする必要があります。これは、Windows には標準で付属していません: http://www.microsoft.com/downloads/en/details.aspx?FamilyID=5e86ec97-40a7- 453f-b0ee-6583171b4530&displaylang=enで、SpeechSDK51.exe を選択します。

SAPI で見つけることができる最高のドキュメントは Web ではなく、SDK 自体の Docs/ フォルダーにあります。.chm はすべてを非常によく説明しています。開始するための追加のリンクを次に示します。

ただし、C++ は必須ではありません。C# で行うことを強くお勧めします。それは本当にはるかに簡単です (COM コンポーネントなし、個別の SDK なし、MSDN のドキュメントの増加、チュートリアルの増加など)。この CodeProject の記事を参照してください。すべての GUI 要素とすべての音声合成要素を削除する必要があります。音声認識は 10 行のコードに要約されます。すごく印象的。

コンパイルされていない、テストされていないサンプルコードを編集します。

using System.Speech;
using System.Speech.Recognition;

// in constructor or initialisation
SpeechRecognitionEngine recognizer = null;
recognizer = new SpeechRecognitionEngine();
recognizer.SetInputToDefaultAudioDevice();
recognizer.SpeechRecognized += new EventHandler<SpeechRecognizedEventArgs>(recognizer_SpeechRecognized);
recognizer.RecognizeAsync(RecognizeMode.Multiple);

// The callback called when a sentence is recognized
private void recognizer_SpeechRecognized(object sender, SpeechRecognizedEventArgs e){
    string text = e.Result.Text;
    // Do whatever you want with 'text' now
}

やった、やった

score 3 · Accepted Answer

Windows は、クライアントとサーバーの両方に音声認識エンジンを提供します。どちらも C++ または .NET 言語でプログラミングできます。C++ でプログラミングするための従来の API は、SAPI として知られています。クライアントとサーバーの音声用の .NET Framework ネームスペースは、System.Speech と Microsoft.Speech です。

SAPI ドキュメント - http://msdn.microsoft.com/en-us/library/ms723627(VS.85).aspx

クライアント認識用の .NET 名前空間は System.Speech - http://msdn.microsoft.com/en-us/library/system.speech.recognition.aspxです。Windows Vista および 7 には音声認識エンジンが含まれています。

サーバー認識用の .NET 名前空間は Microsoft.Speech で、10.2 バージョンの完全な SDK はhttp://www.microsoft.com/downloads/en/details.aspx?FamilyID=1b1604d3-4f66-4241-9a21-で入手できます。 90a294a5c9a4 . 音声エンジンは無料でダウンロードできます。

以前の多くの質問がこれに対処しています。例については、音声認識とSAPIに基づくプロトタイプと Windows 7 の問題を参照してください。

c++ - C++ を使用して Windows 音声認識を呼び出して使用する

2 に答える 2

Related

Reference