録音された音声データを使用して合成音声を生成するオープンソースのオープンコンテンツプロジェクトはありますか?(特定の個人のスピーチを合成/シミュレートすることを目的としています。補足として、このプロセス、目標、または抽出されたデータの名前はありますか?「音声署名」?)
ワークフローは次のようになると思います。
- 標準化されたテキストからスピーチを録音します(「テディはマットの上に座っていました。」)
- アクセントを考慮して、音素(猫の「a」)を選びます
- アリスの「eh」の音をベティの「eh」とは異なるものにするデータを取得する
- アクセントに適した音素と音声署名を使用して、テキストを音声に変換します
この質問に答えることは、人類のために彼のなだめるような声の署名をパブリックドメインに寄付するようにジャックエンジェル(テディ、ウォンカーズ)に請願する際の重要なステップです。