問題タブ [text-to-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - SpeechSynthesizer で一定のメモリ リークが発生する
c#、WPF、および System.Speech.Synthesizer オブジェクトを使用する、リリースしたいプロジェクトを開発しました。このプロジェクトのリリースを妨げている問題は、SpeakAsync が呼び出されるたびにメモリ リークが発生し、最終的には失敗に至ることです。このオブジェクトを使用した後、適切にクリーンアップしたと思いますが、治療法が見つかりません。Ants Memory Profiler を使用してプログラムを実行したところ、呼び出しごとに WAVEHDR と WaveHeader が増加していることが報告されました。
原因を特定するためにサンプルプロジェクトを作成しましたが、まだ途方に暮れています。どんな助けでも大歓迎です。
このプロジェクトは VS2008 を使用し、.NET 3.5 および任意の CPU をターゲットとする ac# WPF プロジェクトです。System.Speech への参照を手動で追加する必要があります。
コードは次のとおりです。
このプログラムを Windows 7 64 ビットで実行すると、新しい SpeechSynthesizer オブジェクトを作成しようとすると実行され、最終的に停止します。Windows Vista 64 ビットで実行すると、メモリは 34k の開始点から約 400k まで増加し、さらに増加します。
これを引き起こしている可能性のあるコードの何かを誰でも見ることができますか、それとも Speech オブジェクト自体の問題ですか?
どんな助けでも大歓迎です。
html - Web ページでテキストを音声に変換する方法は?
ニュース サイト (CNN、BBC など) のテキストの断片を表示する Web ページを作成していますが、それを見えない人にも読んでもらいたいと考えています。テキストを読み取るように HTML ページをプログラムするにはどうすればよいですか? 何か案は?
ありがとう、ボダ・シド。
linux - REALbasic は Linux と同等に話す
私は、Windows と Mac でSpeakキーワードを使用して単語や短いフレーズを出力する小さな REAL Studio アプリをいくつか持っています。
シェル コマンドまたはソフト宣言のいずれかを使用して、アプリの Linux バージョンでこれをエミュレートする方法を推奨できる人はいますか?
これらのアプリは家族でのみ使用するため、必要に応じて Ubuntu にフリー ソフトウェアをインストールできます。
c# - System.Speech and Voices
Scansoft voices .exeファイルからポータブルアプリケーションを作成することは可能ですか?(www.portableapps.com)。
次に、.NET 3.5のSystem.Speech名前空間を介してプログラムで音声にアクセスできますか?
私はそれをやりたいので、テキスト読み上げWebアプリをインストールするためだけに専用サーバーを使用する必要はありません。
ヘルプ !
java - kevin または mbrola を使用する場合の Freetts の例外
freetts を使用してプログラムを実行しようとしています。プログラムをコンパイルすることはできますが、kevinまたはmbrolaの音声を使用することはできません。最後に次の出力メッセージが表示されます。
システム プロパティ「mbrola.base」は未定義です。MBROLA ボイスは使用しません。
LINE UNAVAILABLE: フォーマットは pcm_signed 16000.0 Hz 16 ビット 1 チャネル ビッグ エンディアン
.net - System.Speech.Synthesis.TtsEngine の例?
名前空間 System.Speech.Synthesis.TtsEngine の (単純な) 例を知っていますか?
出力音声のピッチ、レート、ボリュームを制御できる TTS エンジンを使用したいと考えています。上記の名前空間でそれができるように見えますが、例が 1 つも見つかりませんでした。私がやりたいことをするために、テキストを音声に変換する (おそらく巨大で複雑な) コード全体を書き直さなければならないのか、それともプロセスに「フック」していくつかの変数を変更します。
各音素の長さとピッチを簡単に制御できるので、多かれ少なかれ実行可能なオプションは MBROLA です。問題は、MBROLA は音素を音声に変換するエンジンであるため、MBROLA で使用する前にテキストを音素に変換する必要があることです (これは難しい場合があります! たとえば、「I read」と「Ive read」、異なる音素「読む」と「読む」のために!)。
どんな提案でも大歓迎です!
ありがとう!
iphone - Festival の概要 (iPhone)
Festival を iPhone アプリで使いたいです。Festival がオーディオ ファイルを生成して再生する方法を考えると、これは可能ですか? Festival に直接オーディオ ファイルを渡して再生することはできますか? または物事を読む別の方法はありますか?
iphone で使用する C/C++ 用の別のテキスト読み上げエンジンはありますか?
編集:無料の方が良いです。
編集:私のプロジェクトに含めるために絶対に必要なファイルはどれですか?フェスティバルのコアメソッドは何ですか? 例と を見ましたsrc
が、問題があります。
android - Androidで音声合成ラッパーを作成する
GoogleAndroidの音声合成機能のラッパークラスを作成しようとしています。ただし、onInit関数が終了するまでシステムを一時停止する方法を見つけるのに問題があります。下部に添付されているのは、ここで見つけたものに基づいて作成したソリューションの一部です。Androidのスピーチ-Androidでテキストを読み取るにはどうすればよいですか?
ただし、このソリューションは機能していないようです。これが機能しない理由についての考え、またはonInit()呼び出しの後にSpeak()呼び出しが確実に発生するようにするための良いアイデアは何でしょうか?
パブリッククラスSpeechSynthはOnInitListenerを実装します{
}
コンストラクターを介してテキストの文字列を渡し、onInit()関数で再生できるようにすることができました。ただし、プログラムに別のことを言わせる必要があるたびに、テキスト読み上げエンジン全体を破棄して再作成する必要はありません。
windows-mobile - Windows Mobile - 音声制御 + 音声合成 (テキスト読み上げ)
Windows Mobile 6.5 アプリケーションがあり、簡単な音声制御 (「はい」と「いいえ」コマンドの認識など) を追加する必要があります。また、LCD に表示されるテキストを読み取る可能性を追加したいと思います。
このような問題の可能な解決策についての提案をいただければ幸いです。説明されている機能を備えた無料のライブラリはありますか?
助けてくれてありがとう、MatheW
c# - Microsoft Speech Object Library を使用して wav ファイルを作成する方法
C# プログラムで Skype を使用したいと考えています。通話を開始し、受信者が聞くオーディオ ファイルを挿入したいと考えています。
C# で Microsoft Speech Object Library を使用して、スピーカーから直接再生する代わりに、変換されたオーディオ ファイル (wav) を保存することはできますか?