問題タブ [text-to-speech]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - System.Speech Speech Synthesizer の奇妙な問題
私は音声合成を含むプログラムに取り組んでいます。数週間前、紹介文を書きました
プログラム。それはうまくいきました。タスク リストから「音声合成の研究」に取り消し線を引いて、プロジェクトの他の部分に進みました。
今、私は実際のプログラムを書いており、この同じ基本的なコード ブロックを使用しようとしています。ただし、現在はs.SetOutputToWaveFile
通話に失敗しています。PlatformNotSupportedException をスローし、「システムに音声がインストールされていないか、現在のセキュリティ設定で使用できる音声がありません」というメッセージが表示されます。
私は32ビットのVistaを使用しています。私の知る限り、両方のプログラムのコンパイラ設定は同じです。これは Winforms アプリであり、ASP.Net や部分的に信頼されているものではないことに注意してください。Visual Studio の別のインスタンスで元のプログラムを取得しましたが、それでも問題なく動作します。
何か案は?
編集、11/9/09:
報奨金を追加しましたが、今ではこのプログラムだけでも:
失敗します。何らかの権限または設定する必要があるものがあると思いますが、見つかりません。私のもう 1 つのプログラム - この新しいプログラムとまったく同じことを行う最初の基本的なプログラムは、まだ動作します。
c# - SpeechSynthesizer の SpeakProgressEventArgs は不正確ですか?
.Net 3.5 で System.Speech.Synthesis.SpeechSynthesizer クラスを使用すると、SpeakProgressEventArgs の AudioPosition プロパティが不正確に見えます。
次のコードは、次の出力を生成します。
コード:
出力:
ただし、生成される .wav ファイルの長さは 15.69 秒です。Stream または null に出力すると、同じ動作が発生します。
プロパティのドキュメントには、プロパティは「オーディオ出力ストリーム内のイベントの時間位置を表す TimeSpan オブジェクト」であると記載されています。
出力ファイルで単語が話し始めた時間または話し終わった時間を示す正確な時間である必要がありますか、それとも誤解していますか?
objective-c - Mac OS X 用トーキング ヘッド ライブラリ
Mac OS X / Cocoa / Objective-C 用の「トーキング ヘッド」ライブラリはありますか? 具体的には、話されたテキストを口形素/顔の表情に簡単に変換するものですか? Microsoft は Text to Speech API の一部として "Microsoft Agent" を持っていますが、Mac にはこの機能の競争相手がいますか?
.net - 共有ホスティングの Speechlib - ASP.NET
個人の Web サイトで SpeechLib を使用しようとしています。テキストをwavファイルに保存する非常にシンプルなアプリです-標準的なものです。開発マシンでうまく機能します。しかし、共有ホストにデプロイすると、すべてが崩壊します。
wav ファイルの書き込み時に、ユーザー名とパスワードの入力を求められることがあります。時々、「セキュリティ例外」が発生します。このサイトは完全に信頼されており、アプリから単純な txt ファイルを問題なく書き込むことができます。
インターネットを精査すると、SpeechLib コンポーネントが一時的にファイルを次の場所に書き込むことに気付きました。
開発マシンでこれを確認しました。確かにそうです。
したがって、私の推測では、共有ホストでは、ASPNET にはそのフォルダーに書き込む権限がありません (?)。そのため、ホスティング サービスに連絡したところ、Virtual Private Server にアップグレードする必要があると言われました。彼らが何について話しているかを知っているかどうかはわかりません。
SpeechLib を共有ホストで動作させた人はいますか? これが私が直面しているまったく同じ問題です:
http://www.eukhost.com/forums/f41/interop-speechlib-dll-6743/
何かご意見は?
windows - 現実的な無料 TTS プログラム
Festival、espeak、MBROLA を試してみましたが、声はせいぜい平凡で、現在の商用システムほどリアルではありません。たとえば、このデモ: http://www.acapela-group.com/text-to-speech-interactive-demo.html
あなたが試した最もリアルなフリー TTS ボイスは何ですか?
java - WindowsプラットフォームでのFestivalTTSとFreeTTSのパフォーマンスはどうですか?
9時間前、私はWindowsでFestivalTTSをゼロから構築するという素晴らしいアイデアを思いつきました。
その間、30分もかからずに、Linuxで同じソースコードを作成しましたが、それは、大量の開発ツールがすでにインストールされているためです:D
また、今朝、FreeTTSをダウンロードしました。Javaのパワー:Dのおかげで、10分もかからずに簡単なテストプロジェクトを開始しました。残念ながら、FreeTTSは国際的なmbrola言語をすぐにはサポートしていないので、今朝は「作業が多すぎる」と思いました...
多くの障害と大量の間違ったダウンロードの後、WindowsでFestival TTSに戻ると、CYGWINの前に、CYGWIN、次にVisual Studio 2008、次にWindows Platform SDK 2008のインストールで、「make」やその他のエキゾチックなC++ツールが「忘れられ」ました。 System.hがないので、今、Windows Server PlatformSDK2003などをダウンロードしています...
さて、私はまだここにいるので、1行のくそったC--コードをコンパイルしていません。私の質問は、次のとおりです。
少なくともFestivalTTSは、Windows for Java開発に適していますか?
speech-recognition - 組み込みアプリケーション用の音声認識エンジン
WindowsCE音声対応アプリケーションを開発するために利用可能な音声認識エンジンとSDKを調査しようとしています。私はニュアンスに出くわしましたが、他には何も見えません。可能であれば.NetSDKを使用したいと思いますが、ほとんどはC /C++だと思います。何か提案をいただければ幸いです。ありがとう。
text-to-speech - テキストから音声へのソフトウェア
テキストから音声へのコンバーターのようなアプリケーションソフトウェアを作成するのに適したプログラミング言語。
apache-flex - as3 でのテキスト読み上げ
as3/flex で使用できるテキスト読み上げコンポーネントを探しています。
ありがとう
c# - .NET 3.0 Text to Speech WAV 出力が大きすぎて処理が遅い
テキストを取り込んでオーディオ wav に変換する小さなアプリケーションを作成しました。現在、作成された wav ファイルが大きすぎることを除けば、問題なく動作します。
wav出力を小さくして、プロセス全体の時間を短縮する方法を探しています。
サンプルコード: