open-source - FLOSSプロジェクトは、音声合成に人間の入力を利用していますか？

Question

録音された音声データを使用して合成音声を生成するオープンソースのオープンコンテンツプロジェクトはありますか？（特定の個人のスピーチを合成/シミュレートすることを目的としています。補足として、このプロセス、目標、または抽出されたデータの名前はありますか？「音声署名」？）

ワークフローは次のようになると思います。

標準化されたテキストからスピーチを録音します（「テディはマットの上に座っていました。」）
アクセントを考慮して、音素（猫の「a」）を選びます
アリスの「eh」の音をベティの「eh」とは異なるものにするデータを取得する
アクセントに適した音素と音声署名を使用して、テキストを音声に変換します

この質問に答えることは、人類のために彼のなだめるような声の署名をパブリックドメインに寄付するようにジャックエンジェル（テディ、ウォンカーズ）に請願する際の重要なステップです。

score 1 · Accepted Answer

これは、カーネギーメロン大学が後援するfestvoxと呼ばれるオープンソースプロジェクトであり、特定のスピーカーで合成された音声を構築することを目的としています。ここでコンセプトを説明しますが、正しく調整するには非常に時間のかかるプロセスのようです。BableFish.orgには、Text-To-Speechオープンソースプロジェクトの優れたリストがあります。特定のスピーカーの周りにTTSエンジンを構築することについて、 Text ToSpeechBlogに良い議論があります。

open-source - FLOSSプロジェクトは、音声合成に人間の入力を利用していますか？

1 に答える 1

Related

Reference