問題タブ [sapi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - .netFramework3.5からSAPI4音声にアクセスする方法
WindowsXPでSystem.Speech.Synthesisを使用して.net3.5のSAPI4エンジン(L&H TTS 3000)を使用しようとしています。
問題は、GetInstalledVoicesを呼び出したときにのみSAPI5.1エンジンを取得できることです。
スペイン語のTTSエンジンが必要で、L&H TTS 3000が無料で見つかった唯一のエンジンであるため、SAPI4を使用しています。
c++ - マルチスレッドでSAPIを使用してテキストをWaveに変換する方法は?
次の関数を使用してテキストをWaveファイルに変換しようとしています。メインUIスレッドから呼び出された場合は正常に動作します。ただし、別のスレッドから呼び出すと失敗します。マルチスレッド関数から呼び出す方法は?
speech-recognition - SAPI 4インターフェースを介してNaturallySpeakingに接続することは可能ですか?
エクスポートするSAPI4インターフェイスを介してNaturallySpeakingにインターフェイスできることをどこかで読みましたか?これは本当ですか、ドキュメントはありますか?ありがとう
.net - WCF アプリからの SAPI アクセス
WCF アプリから SAPI にアクセスすることは可能ですか?
c# - Web サービスの C# SAPI
この正確なコードは WinForm アプリで機能しますが、Web サービス内で実行すると、次のようになります。
このエラーの原因となっている可能性のあるアイデアはありますか? エラーコードの意味
完全を期すために、ここに SetVoice メソッドがあります
ファイルが書き込まれる C:\Temp フォルダーの USERS にフル アクセスを許可しました。どんな助けでも大歓迎です!
c# - System.Speech.Recognition.SpeechRecognitionEngine へのストリーミング入力
TCP ソケットから C# で「ストリーミング」音声認識を実行しようとしています。私が抱えている問題は、 SpeechRecognitionEngine.SetInputToAudioStream() がシークできる定義された長さのストリームを必要とするように見えることです。今のところ、これを機能させるために考えられる唯一の方法は、より多くの入力が入るたびに MemoryStream で認識エンジンを繰り返し実行することです。
説明するコードを次に示します。
これを回避する方法を知っている人はいますか?SetInputToDefaultAudioDevice() を使用してマイクで正常に動作するため、何らかのストリーミング入力をサポートする必要があります。
ありがとう、ショーン
sapi - SAPIを使用してオーディオ(wavファイル)をテキストに変換しますか?
私の仕事は、人間からの直接話法ではなく、音声ファイルをテキストに変換することです。
たとえば、wavファイルに「Hellothere」ストアがある場合、それをテキストに転記し、画面に「Hellothere」文字列を表示します。
優先されるが優先される言語コードはC#です。
c# - .NET の音声認識クラスに関する質問
.NET 音声認識クラスを使用してアプリケーションを構築し、WAV ファイルを渡して、そのテキスト表現を作成することは可能ですか。たとえば、これは私がやろうとしていることです:
私のオフィスには QA 部門があり、1 日に何百件もの電話に耳を傾けなければなりませんが、これはまったく不可能なことです。私がやりたいことは、オーディオ ファイルをサーバーにアップロードし、サーバーにそれを解析させてトランスクリプトを作成させることです。完璧でなくてもかまいませんが、2 時間の録音を聞くよりも数十行のテキストをざっと目を通しておいた方が簡単なベースにすぎません。
保存されたトランスクリプトに基づいて、データベース内で全文検索を実装できます。また、誰かが間違った表現を言っている場合は、トランスクリプトに対してチェックを実行することもできます。
では、.NET 音声認識クラスを使用してアプリケーションを作成し、それに WAV ファイルを渡すだけで大まかなトランスクリプトを出力することは可能ですか?
アイデアを考えている間、Speech クラスで MSDN を簡単に掘り下げました。
可能であれば、C# での例を教えていただければ幸いです。トピック1055347は、私が抱えている質問に似ており、リンクが提供されました。その中で最も具体的なのは C++ です。私は C++ の開発者ではありませんし、プログラミングのために学校に通ったこともありません。C# については独学なので、自分が知っている言語にとどまりたいと思っています。
前もって感謝します!
c# - .NET 3.0 Text to Speech WAV 出力が大きすぎて処理が遅い
テキストを取り込んでオーディオ wav に変換する小さなアプリケーションを作成しました。現在、作成された wav ファイルが大きすぎることを除けば、問題なく動作します。
wav出力を小さくして、プロセス全体の時間を短縮する方法を探しています。
サンプルコード: