問題タブ [speech-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C#とSAPI、私は音声認識を持っていますが、それは興味のない単語を拾います.どうすればグラマーディクテーションを制限できますか?
ふぅ、大きなタイトルですが、そうです、それが質問を要約しています.
私は、Microsoft SAPI を使用して C# で作業しており、作業中のプログラムで音声認識を使用しています。
私がそれをしているのは何ですか。文法 = objRecoContext.CreateGrammar(0);
カスタムワード用。しかし、これは私が望む以上のものを拾います。どうすればこれを修正できますか。
私が求めているのは、どうすれば m$ sapi に、私が望む言葉だけを気にさせることができるかということです。デフォルトの辞書のすべての単語ではありません。
speech-recognition - 単語のリストが多い場合、音声認識用の文法ファイルを効率的に作成するにはどうすればよいですか?
手動でできるので、たった50語で音声認識用の文法ファイルを簡単に書くことができます。10,000語または100,000語の場合、最も簡単で効率的な方法は何ですか。
例:
「RCコーラ」と「ペプシコーラ」があるとします。次の2つのルールで構成される文法ファイルがあります
。DRINK:(COLANAME?[coke cola soda])
COLANAME:[rc pepsi]
"RC"、 "RC Coke"、 "RC Cola"、 "RC Soda"、"を認識します。 「ペプシ」、「ペプシコーラ」、「ペプシコーラ」、「ペプシソーダ」。
編集:私は音声認識のための文法について話している。音声認識システムには、何を認識するか(gsl、grxml)がわかるように、付随する文法ファイルが必要です。実は、言葉だけでなく、名前のようにカテゴリーに分類できないものも考えていました。
mfc - SAPI はどこで入手できますか?
音声対応のアプリケーションを作成したいのですが、MS の Web サイトにアクセスして SAPI をダウンロードしようとすると、エラーが発生します。
どこで SAPI を入手できるか知りたいです。
また、SAPI 5.3 アプリケーションが Windows 2000、Windows XP、および Windows Vista (C++/MFC でコーディングされている場合) で動作するかどうかも知りたいです。
また、 SAPI を使用する最良の方法は何ですか? C# .NET または C++/MFC で?
ありがとう。
c# - C# 音声認識 VISTA の問題
プロジェクトを実行しようとすると、次のエラーが発生します。
Form1 コード:
java - Javaでの音声認識
プロジェクトで音声認識を使用したいのですが、このコードを見つけましたが、実行すると次のようなエラーが発生します。
この問題で私を助けてくれませんか?
これは私が使用するサーバーコードです:
objective-c - Mac OS X 音声からテキストへの API。方法?
TCP/IP からビットのオーディオ (モノラル) ストリームを受信するプログラムがあります。Mac OS X の音声 (音声認識) API が音声からテキストへの変換を実行できるかどうか疑問に思っています。
(最初にオーディオを .wav に保存し、オンザフライで変換するのとは対照的にそれを読んでもかまいません)。
公式ドキュメントをオンラインで読みましたが、少し混乱しています。そして、このトピックに関する良い例が見つかりませんでした。
また、Cocoa/Carbon/Java または Objective-C で行う必要がありますか?
誰かが光を当てることができますか?
ありがとう。
flash - Flashで音(拍手など)を認識する方法は?
私のウェブサイトの訪問者がちょうど2回手をたたいたかどうかを認識する最も簡単な方法は何ですか?
私の考え:ユーザーが許可した場合、Flashはマイクを使用できます。
linux - Linux 用のテキスト読み上げおよび音声認識ツールが必要
テキスト読み上げおよび音声認識を使用する Linux 用のプログラムを作成する予定です。これに最適なツール/ライブラリは何ですか? より優れたツールを使用するには、代わりに Windows を使用する必要がありますか? ツールは、コンソールまたは C プログラムから簡単に呼び出せる必要があります。