54

私は今、Java Text to Speech (TTS) フレームワークを探しています。調査中に、JSAPI 実装ページにリストされているJSAPI1.0と(部分的に)互換性のあるフレームワークがいくつか見つかりました . また、現在 JSAPI のリファレンス実装が存在しないことにも注意しました。

私が FreeTTS に対して行った簡単なテスト (JSAPI impls ページにリストされている最初のもの) は、単純で明白な単語 (例: ABC、黒板) を読み取るには程遠いことを示しています。他のテストは現在進行中です。

そして、ここに質問があります(実際には6):

  1. 使用したことがある Java ベースの TTS フレームワークはどれですか?
  2. あなたの意見では、最大の単語ベースを読み取ることができるのはどれですか?
  3. 彼らの声質はどうですか?
  4. 彼らのパフォーマンスはどうですか?
  5. Javaバインディングを備えたJava以外のフレームワークはどれですか?
  6. それらのどれをお勧めしますか?

コメントや提案をお寄せいただきありがとうございます。

4

9 に答える 9

18

私は実際にFreeTTSでかなり幸運でした

于 2008-09-27T11:36:42.700 に答える
12

Google 翻訳には秘密の tts API があります: https://translate.google.com/translate_tts?ie=utf-8&tl=en&q=Hello%20World

于 2013-09-13T15:36:58.630 に答える
7

私は以前にメアリーを使用したことがあり、声の質に非常に感銘を受けました。残念ながら、私は他のものを使用していません。

于 2008-09-27T10:58:04.540 に答える
5

JSAPIおよびMSSAPIフックを提供するAT& TNaturalVoicesを使用しました。優れた品質の音声、優れた「一般的な」音声辞書、発音に対する多くのコントロール、および複数の言語を提供します。少し高価ですが、非常にうまく機能します。

私はそれを使用して、モバイルセンサーアプリケーションでドライバーに重要なセンサーテレメトリを読み取りました。音声品質についての不満はありませんでした。科学用語ではすぐに使用できる精度が約75%で、通常の会話でははるかに高い(おそらく90%以上)。マークアップを使用することで、最大で約99%以上の精度が得られました(ほとんどのエラーは、異常な音素の組み合わせによる科学用語でした)。

プロセッサでは少し大変でした(Pentium-IIIと同等のマシンで実行していて、50%〜75%のピークCPUをプッシュしていました)。これは、Javaインターフェイスを備えたネイティブ音声エンジン(Windows、Linux、およびMac互換)を使用します。

さまざまな声や言語があります...

于 2008-09-29T19:30:42.153 に答える
1

皆さん、どうもありがとう。秘訣は FreeTTS ソースにあります。簡単に言えば、 として実行java -jar freetts.jar some-more-args-hereされている場合、bin/Server.jar および bin/Client.jar の方法で実行されている場合よりも少ない単語を綴ります。

于 2008-09-29T09:28:21.273 に答える
1

私は FreeTTS を使用しましたが、MBrola の音声を My MacbookPro で実行するには大きな問題がありました。MBrola の音声を Windows (痛々しいほど) と Linux で実行できるようにしました。FreeTTS に他の音声パッケージをロードできなかったのは残念です。それ以外では、Cloudgardenでも少し成功しましたが、それはWindows AFAIKでしか実行できません。このタイプの作業は特にやりがいがあるので、音声エンジンの成功/失敗を他の人に聞いてみたいと思います。また、Sphinx4 を少しいじっています。昨夜、JVXML (Sphinx4 に基づいているようです) をプルダウンしましたが、奇妙な理由で実行できませんでした。

于 2009-04-10T13:32:55.903 に答える
1

私はメアリーに貢献しました。私よりも賢い誰かが HMM 音声をコアから切り離せば、可能性があると思います (これらの音声は大きなデータ セットを必要とせず、問題なく聞こえます)。私はまた、単語を言うときにイベントを送信するためのイベント システムを freetts に実行しようとしています。私は成功しましたが、現在Linuxでは壊れています。(おそらくタイマーのバグのため)。

于 2010-02-27T14:19:20.073 に答える
0

私はMarryTTSに少し慣れていませんでした。多言語で明確な音声で理解できます。

音声をテキストに変換する場合、より適切なオプションは sphinx4-5prealphaです。調整可能で、柔軟性があり、変更可能な認識機能と文法を備えているため、私は 1 つの親指を与えます。

于 2017-08-08T12:21:31.763 に答える