問題タブ [sapi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows-7 - SAPIとWindows7の問題
Windows 7で音声を認識しようとしていますが、常に音声をコマンドとして認識するか、「それは何でしたか?」とだけ表示されます。
どうすればすべてのスピーチを取得できますか?
コード:
delphi - SAPI Text-To-Speech のスペイン語へのローカライズ
次のコードを使用して、Delphi/Lazarus で SAPI Text-To-Speech を使用することができました。
このコードは、英語の標準音声を自動的に選択します。スペイン語にローカライズする必要があるため、自分のシステム (標準スペイン語の Windows XP) にスペイン語の音声があるかどうか、またはインストールする必要があるかどうか、およびデフォルトの音声を変更する方法を調査しましたが、今のところうまくいきません。したがって、私の質問は次のとおりです。
- システムに既にスペイン語の音声がインストールされているか、インストールする必要があるかを知るにはどうすればよいですか?
- 必要な音声がインストールされている場合、SAPI で標準の音声の代わりにその音声を使用するにはどうすればよいですか?
次のコードを使用してスペイン語の音声を取得できると思います (C0A はスペイン語のコードです)。
使用するボイスの設定方法がわかりません。
編集: 混乱を避けるために、これを Delphi および Lazarus と互換性を持たせる必要があります。これは、主要な開発ツールの最後の 1 つです。
c# - C# で MS-SAPI 5.1 を使用して複数の TTS "wav" ファイルを作成できない
皆さん、こんにちは!
TTS を使用して名前の WAV ファイルを作成する必要があるプロジェクトに取り組んでいます。
MS-SAPI 5.1 SDK を Windows Server 2003 にインストールし、C# を使用して TTS プログラムを作成しています。デフォルトの Microsoft Sam の声とは別に、NeoSpeech TTS からの声がサーバーにインストールされています。
私が抱えている問題は、プログラムが複数の作業 WAV ファイルを生成しないことです。
具体的には、プログラムに 4 つの名前を送信すると、プログラムは 4 つの WAV ファイルを作成します。ただし、名のみが正しく変換されます。ファイル サイズは 1 kb を超えており、ファイルはメディア プレーヤーでも再生されます。
他の 3 つのファイルが作成されますが、サイズは 1 kb で、どのメディア プレーヤーでも機能しません。
私は C# と MS-SAPI の両方に慣れていませんが、コードを作成するのに十分な仕事をしたと思います。私はこれを理解しようと何日も費やしましたが、今はエネルギーがありません.
この問題に関する洞察は大歓迎です。御時間ありがとうございます。
これが私のコードです:
編集:
私はいくつかの新しい行動に気づいたようです。このコードは、システム上の Microsoft 音声に対して正常に機能します。この問題があると思われるのは、NeoSpeech の音声のみです。
それは私のコードが正しく、声に何か問題があるということですか? 一つには、お客様から声をいただいたので、どうしようもありません。第二に、これらはプロダクション対応の声です。私は彼らが十分にテストされていると確信しています。
私はまだ、私が書いたコードに何か問題があると信じがちです。
他に利用可能な提案はありますか?私はここで本当の修正をしています。助けていただければ幸いです。
multithreading - スレッドで sapi を呼び出すと、エラー コードが表示されます: OLE エラー 80045006
CoInitialize を呼び出しました。私のコードは次のとおりです。
エラーは、ネオスピーチの音声を選択したときにのみ発生しました。
vb.net - プログラミングエラー
エラーが発生します
名前「SVEPhoneme」は宣言されていません。
どこでどのように宣言しますか?
vb.net - BackGroundWorkerに引数を渡す方法
text2をvox.speakに渡すにはどうすればよいですか?
vb.net - ストリーミングオーディオを停止する方法
sapiを使用してオーディオストリームを再生したら、どうすれば停止できますか。文のセット全体をスキップする必要がありますか?
編集:オーディオを一時停止したら停止する方法。
sapi - 音声トレーニング ファイルとレジストリの場所
コードで音響トレーニングを行う必要がある音声プロジェクトがあります。Windows 7 で、SAPI を使用してトランスクリプトとそれに関連するレジストリ エントリを含むトレーニング ファイルを作成することに成功しました。ただし、認識エンジンがこれらのファイルを正常に使用してモデルを適応させているかどうかを判断することはできません。私の質問は次のとおりです。
コントロール パネルのトレーニング UI を使用してトレーニングを実行すると、システムはトレーニング ファイルを "{AppData}\Local\Microsoft\Speech\Files\TrainingAudio" に保存します。オーディオ トレーニング ファイルはこの場所に保存する必要がありますか?それとも、プロファイルのレジストリ エントリが正しいパスを反映している限り、別の場所に保存できますか?
- 音声コントロール パネルは、トレーニング オーディオ ファイルのレジストリ エントリをキー "HKCU\Software\Microsoft\Speech\RecoProfiles\Tokens{ProfileGUID}{00000000-0000-0000-0000-0000000000000000}\Files" に作成します。
a) トレーニング コードによって作成されたレジストリ エントリは、"{00000000-0000-0000-0000-0000000000000000}\Files" に配置する必要がありますか? または {ProfileGUID} の下に新しいランダム GUID を作成できますか?
b) サブキーは「ファイル」という名前にする必要がありますか?
c) また、レジストリ値は「TrainingAudio-xxxx-xxxxxxxx-xxxxxxxx」の形式に従う必要がありますか?それとも他の値を使用できますか?
d) 最後に、レジストリ値データの形式は「%1c%\Microsoft\Speech\Files\TrainingAudio\SP-xxx....xxx」です。絶対パスを指定できますか?
e) ファイル名は「SP-xxx....xxx.wav」の形式に従う必要がありますか、それとも一意のファイル名を使用できますか?
ありがとう。
ギリ
c++ - 現在の TTS 音声の言語を取得する
TTS エンジンが使用する現在の音声の言語を取得する最良の方法は何ですか?
私は次のようなものを使用すると思いました
しかし、これから LangId を抽出して現在の言語を特定する方法がわかりません。私が見たガイドはすべて、声の変更に対処しているようです。現在の音声を保持してから、ユーザーがシステム用に既に選択した音声に合わせて何かを行うことをお勧めします。
speech-recognition - SAPIによる音声認識:音素によるカスタム言語サポート
テキストから音素に転記したテキストがあります。
ここで、国際音素を使用した単語の発音を定義するカスタム文法XMLを変更または作成し、その特定のスペルでその文法を他のものの代わりに認識できるようにします。
英語/ドイツ語などとは異なる言語で話されている特定の単語に音声認識を追加したい。
それはSAPIで可能でしょうか?誰かが私を正しい方向に向けることができますか(SpInProcRecoContext.Recognizerとカスタム文法を使用して)
そのため、既存のea englishの認識エンジンを使用して、たとえば、電話でイタリア語を定義し、エンジンにそれらを英語のカスタム単語として認識させて、一部のイタリア語も認識できるようにすることで、イタリア語を認識したいと思います。