問題タブ [speech-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
speech-recognition - 認識される前に入力音声を取得する方法
認識される前に入力音声を取得する方法。たとえば、「ヘル」と言うと、辞書に見つからないか、別の単語だと思います。私はただ「ヘル」を手に入れたいだけです
c++ - C++ で音声認識とテキスト読み上げを実装するには?
音声認識とテキストから音声への変換を行うためのさまざまな手法について知りたいです。また、リンク、チュートリアル、電子ブックなどのリソースについてもお知らせください。
それを達成するための最も効率的な手法はどれですか?
.net - カスタム .net アプリの Speech to Text に関する考慮事項
私は、社内でのみデータ入力に使用される .Net 3.5 WinForm アプリです。ほとんどの場合、さまざまな形式のテキストボックスなどです。Windows 7 の音声認識では、アプリで「すぐに」動作するようです 。
私が疑問に思っているのは、それが完全に真実であるかということです。アプリで最高レベルの使いやすさを確保するには、どのような手順を踏む必要がありますか? UI 要素やその他のタグを使用していますか。
ここでSystem.Speech.Recognition Namespace
話していることを含める必要がありますか
ガイダンスやアドバイスをいただければ幸いです。主に、要素に音声認識用の特定のハンドルを与える方法。
c++ - 完全にC\C ++プログラミング言語で書かれたlibを使用して、pcmオーディオをテキストに変換するにはどうすればよいですか?
完全にC\C ++プログラミング言語で書かれたlibを使用して、pcmオーディオをテキストに変換するにはどうすればよいですか?
だから私はpcmファイルを持っています。テキストにしたいと思います。どうやってするの?(あなたの選択の音声認識ライブラリを使用して(ところで私はそれが非常に速く動作する必要があります)
だから私は何が必要ですか?
- オープンソースライブラリ。
- 方法/使用方法に関するチュートリアルとブログ記事。
java - どのAPIがNokiaforSoundtotextおよびtexttosound変換を提供しますか?
JavaまたはC++プログラマー向けのSoundtoTextおよびTexttoSound変換にNokiaを提供するAPIはどれですか?
私が必要なものは何?
- あなたの選択の最高のAPIへのリンク
- トピックに関する最高のブログ記事/チュートリアルへのリンク
c# - Microsoft Sam、SAPI の代替
Microsoft Speech API を使用する予定のアプリケーションがあります。現在、Microsoft Sam の音声を使用して Windows XP でテストしましたが、率直に言ってひどい音です...音声が何を言おうとしているのかを聞くことはほとんど不可能です。
他にもっと良い声はありますか?より優れたアップデートまたは新しいバージョンはありますか。代替として機能する他の製品、オープン ソース プロジェクトなどはありますか?
明確にするために-実際にプログラムできるように、ある種のAPIが必要です。
c# - 音声認識プロジェクト
私は最終年度のプロジェクト、つまり音声認識を作成しています。でもどうやって始めたらいいのかわからない。c#を使用します。誰かが私に始める方法を教えてもらえますか?最初のステップは何ですか?
ありがとう
speech-recognition - SDKを使用した話者依存の音声認識エンジン
私は少し応用したいと思っています.SDKを使用した優れた話者依存の音声認識エンジンを知っている人はいますか. (音声からテキストへのエンジンではありません)
ありがとうございました、
エフラット
c# - System.Speech.Recognition 認識プロファイルの選択
.NET アプリケーション内から認識プロファイルを変更する方法を知っている人はいますか?
System.Speech.Recognition 名前空間にある機能を使用して音声認識を行う .NET アプリケーションを作成しています。システムに供給しているオーディオは、複数の異なるユーザーからのものです。さまざまなユーザーの音声をより正確に認識できるようにシステムをトレーニングできるようにしたいと考えています。
Windows (この場合は Windows 7) でトレーニング プロファイルを構成できる音声認識コントロール パネルを見つけました。自分のプロファイルを設定し、トレーニング プロセスを実行することで、認識の精度が大幅に向上しました。そのため、すべてのユーザーのプロファイルをセットアップしてトレーニング プロセスを実行させることができますが、アプリケーションで適切なプロファイルを選択できるようにする必要があります。
私のアプリケーションは、一度に 1 人以上のユーザーからオーディオ ストリームを受信し、音声認識を実行する「サーバー」です。そのため、アプリケーションが作成する認識エンジンのインスタンスごとに、どの認識プロファイルをプログラムで使用するかを指定できる必要があります。これはシングル ユーザー アプリケーションではないため、Windows コントロール パネルからプロファイルを選択させることはできません。
cocoa - SSpeechRecognizerデリゲートは、話された単語に対して呼び出されます
NSSpeechRecognizerについて読んだところ、デリゲートで関連付けられている一連のコマンドを認識できることがわかりました。-speechRecognizer:didRecognizeCommand:簡単な質問があります。このデリゲートは、ユーザーが話す任意の単語に対して呼び出すことができますか?私が思うように..それに関連付けることができるのは有限数の単語だけです!
ありがとう、
ミラジ