問題タブ [text-to-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - C#のSpeechSynthesizerは、22kHzのwavを作成します...16kHzである必要があります
私のC#アプリケーションは、テキストをwavファイルに変換し、Skype通話に挿入する必要があります。wavファイルを作成するコードは以下のとおりです。問題は、ファイルのサンプルレートが22kHzで、Skypeが16kHzしか受け入れないことです。
この設定を調整する方法はありますか?
c++ - WindowsでのSAPI/dllの使用法について話しますか?
質問:espeaktext-to-speechengineを使用しようとしています。だから私はそれをLinux上でひどく動作させました(以下のコード)。今、私もこの基本的なプログラムをWindowsに移植したかったのですが、それはほぼ不可能です...
問題の一部は、windows dllがAUDIO_OUTPUT_SYNCHRONOUSのみを許可することです。これは、コールバックが必要であることを意味しますが、コールバックからオーディオを再生する方法がわかりません...最初にクラッシュし、次に気づきました。コールバック関数、コールバック関数でデータを取得しましたが、再生方法がわかりません...これはwavファイルではなく、Linuxのように自動的に再生されるためです。
sourceforgeサイトは、基本的にSAPIバージョンを使用すると書かれているため、かなり役に立ちませんが、sapiespeakdllの使用方法の例はありません...
とにかく、これが私のコードです、誰か助けてもらえますか?
上記のコードはLinux用です。以下のコードは、Vista x64(32ビットemu)で取得したものとほぼ同じです。
c++ - スレッド外のスレッドデータにアクセスする方法
質問:DLL_attachでのクラッシュを回避するために、スレッドでMSテキスト読み上げエンジンを起動します。正常に起動し、音声合成エンジンが初期化されますが、スレッドの外部でISpVoiceにアクセスできません。スレッドの外部でISpVoiceにアクセスするにはどうすればよいですか?結局のところ、それはグローバル変数です...
XPThreadsはここにあります:http: //www.codeproject.com/KB/threads/XPThreads.aspx
android - TextToSpeech setOnUtteranceCompletedListenerは常に-1エラーを返しますか?
私はAndroidのTTS関数を使用して一般的な成功を収めてきましたが、その一部が私のために機能することを拒否しています。OnUtteranceCompletedListenerをTextToSpeechオブジェクトに正常に割り当てることができません。
クラスの1つにOnUtteranceCompletedListenerを実装してみました。また、新しいスタンドアロンのOnUtteranceCompletedListenerインスタンスを作成してみました。どちらのアプローチも実装が簡単で、例外なく適切なリスナーを生成するように見えます...それでもsetOnUtteranceCompletedListener(myListener)は常に-1(エラー)を返します。
このためのドキュメントは簡単に思えます。誰かがこれを機能させましたか?SDK 4をターゲットにしています。SDK4/v1.6でこれに既知の問題はありますか?
c# - 多言語テキスト読み上げライブラリ?
私は現在、さまざまな言語でテキストを読み上げる機能を持つ小さなクライアントの開発を検討しています。主に英語と日本語を対象としています。
私の質問は、英語と日本語を読み上げて読み上げることができるライブラリを知っている人はいますか?
私の最初のターゲット開発言語はc#です
御時間ありがとうございます。
visual-c++ - C++ Microsoft SAPI: Windows のテキスト読み上げ出力をメモリ バッファーに設定する方法は?
Windows SAPI 5.1 を使用してテキストをメモリ バッファーに "読み上げる" 方法を見つけようとしましたが、これまでのところ成功していません。
合成音声を .wav ファイルにストリーミングする例はありますが、メモリ バッファーにストリーミングする方法の例はありません。
最後に、合成音声を 16 kHz 16 ビット リトルエンディアン PCM 形式の char* 配列にする必要があります。現在、一時的な .wav ファイルを作成し、そこに音声出力をリダイレクトしてから読み取りますが、それはかなりばかげた解決策のようです。
誰もそれを行う方法を知っていますか?
ありがとう!
text-to-speech - Microsoft TTS (テキスト読み上げ) Dat ファイルの場所
わかりましたので、デフォルトのMicrosoft TTSエンジンを置き換えるためにいくつかのTTSエンジンをダウンロードし、プログラムをもう少し「人間的」に聞こえるようにしました-基本的に、TTSエンジンファイルがローカルPC(Windows 7 )
-- 私が持っているファイルは .Dat 形式です。Text-to-Speech の音声として登録する必要がある場所を知っている人はいますか?
乾杯。
@UPDATE: わかりまし
た。レジストリを検索した後、dat ファイルの新しいレジストリ キーと値を作成する必要があることがわかりました。ファイルの場所、フォーマットなどについて... Text-To-Speech Voice を読み込もうとすると、次のエラーが表示されます。「この音声は再生できません。別の音声を選択するか、別の音声出力デバイスを選択してください。」 - 何か案は?-- ダウンロードした DAT ファイルのエンコーディングを確認する方法はありますか?
c++ - g++ を使用して C++ プログラムでフェスティバル TTS ライブラリをリンクする方法
私は Festival c++ Api を使用していますが、
http://www.cstr.ed.ac.uk/projects/festival/manual/festival_28.html#SEC132
festival/src/lib/libFestival.a などをリンクすると言っているので、それらを私の C++ プログラムにリンクする方法を教えてください
c++ - Linux で利用できる音声ライブラリは何ですか?
Linux の TTS (テキスト読み上げ) ライブラリに関して言えば、開発者にはどのような選択肢がありますか?
ほとんどのディストリビューションに同梱されているライブラリは何ですか?
最小限のライブラリはありますか? 各ライブラリはどのような機能を提供していますか?
私は主に C++ の観点からこれに取り組んでいますが、Python も私には適しています。
ms-word - Word ドキュメントを MP3 形式に変換する .NET ライブラリ/ユーティリティはありますか?
Web ベースの文書管理システムに保存した文書を聴覚障害者が「聞く」ことができるように、Microsoft Word 文書を MP3 または WAV 形式に変換するための十分にサポートされている/実証済みの方法を知っている人はいますか?
私はすでに、誰かが電話を使って利用可能なドキュメントのリストを取得し、日付とタイトルを電話で「読み上げる」ことができるように構築されたインターフェイスを持っていますが、今は誰かが実際に内容を聞くことができるようにしたいと考えていますシステムに保存されているWordファイルの。
理想的には、各アップロード後に DOC -> MP3 を変換できる .NET ライブラリまたはユーティリティが最適ですが、オンデマンドでファイルを「読み取る」ものでも問題ありません。