java - Java: Text to Speech エンジンの概要

Question

私は今、Java Text to Speech (TTS) フレームワークを探しています。調査中に、JSAPI 実装ページにリストされているJSAPI1.0と(部分的に)互換性のあるフレームワークがいくつか見つかりました。 . また、現在 JSAPI のリファレンス実装が存在しないことにも注意しました。

私が FreeTTS に対して行った簡単なテスト (JSAPI impls ページにリストされている最初のもの) は、単純で明白な単語 (例: ABC、黒板) を読み取るには程遠いことを示しています。他のテストは現在進行中です。

そして、ここに質問があります（実際には6）：

使用したことがある Java ベースの TTS フレームワークはどれですか?
あなたの意見では、最大の単語ベースを読み取ることができるのはどれですか?
彼らの声質はどうですか？
彼らのパフォーマンスはどうですか？
Javaバインディングを備えたJava以外のフレームワークはどれですか?
それらのどれをお勧めしますか?

コメントや提案をお寄せいただきありがとうございます。

score 18 · Accepted Answer

18

私は実際にFreeTTSでかなり幸運でした

于 2008-09-27T11:36:42.700 に答える

score 12 · Accepted Answer

Google 翻訳には秘密の tts API があります: https://translate.google.com/translate_tts?ie=utf-8&tl=en&q=Hello%20World

score 7 · Accepted Answer

私は以前にメアリーを使用したことがあり、声の質に非常に感銘を受けました。残念ながら、私は他のものを使用していません。

score 5 · Accepted Answer

JSAPIおよびMSSAPIフックを提供するAT＆ TNaturalVoicesを使用しました。優れた品質の音声、優れた「一般的な」音声辞書、発音に対する多くのコントロール、および複数の言語を提供します。少し高価ですが、非常にうまく機能します。

私はそれを使用して、モバイルセンサーアプリケーションでドライバーに重要なセンサーテレメトリを読み取りました。音声品質についての不満はありませんでした。科学用語ではすぐに使用できる精度が約75％で、通常の会話でははるかに高い（おそらく90％以上）。マークアップを使用することで、最大で約99％以上の精度が得られました（ほとんどのエラーは、異常な音素の組み合わせによる科学用語でした）。

プロセッサでは少し大変でした（Pentium-IIIと同等のマシンで実行していて、50％〜75％のピークCPUをプッシュしていました）。これは、Javaインターフェイスを備えたネイティブ音声エンジン（Windows、Linux、およびMac互換）を使用します。

さまざまな声や言語があります...

score 1 · Accepted Answer

皆さん、どうもありがとう。秘訣は FreeTTS ソースにあります。簡単に言えば、として実行java -jar freetts.jar some-more-args-hereされている場合、bin/Server.jar および bin/Client.jar の方法で実行されている場合よりも少ない単語を綴ります。

score 1 · Accepted Answer

私は FreeTTS を使用しましたが、MBrola の音声を My MacbookPro で実行するには大きな問題がありました。MBrola の音声を Windows (痛々しいほど) と Linux で実行できるようにしました。FreeTTS に他の音声パッケージをロードできなかったのは残念です。それ以外では、Cloudgardenでも少し成功しましたが、それはWindows AFAIKでしか実行できません。このタイプの作業は特にやりがいがあるので、音声エンジンの成功/失敗を他の人に聞いてみたいと思います。また、Sphinx4 を少しいじっています。昨夜、JVXML (Sphinx4 に基づいているようです) をプルダウンしましたが、奇妙な理由で実行できませんでした。

score 1 · Accepted Answer

私はメアリーに貢献しました。私よりも賢い誰かが HMM 音声をコアから切り離せば、可能性があると思います (これらの音声は大きなデータセットを必要とせず、問題なく聞こえます)。私はまた、単語を言うときにイベントを送信するためのイベントシステムを freetts に実行しようとしています。私は成功しましたが、現在Linuxでは壊れています。（おそらくタイマーのバグのため）。

score 0 · Accepted Answer

私はMarryTTSに少し慣れていませんでした。多言語で明確な音声で理解できます。

音声をテキストに変換する場合、より適切なオプションは sphinx4-5prealphaです。調整可能で、柔軟性があり、変更可能な認識機能と文法を備えているため、私は 1 つの親指を与えます。

java - Java: Text to Speech エンジンの概要

9 に答える 9

Related

Reference