speech-recognition - テキスト読み上げ、音声合成、Re：できますか？

Question

ですから、私はここではまったく新しいので、いくつかの情報を探すのに苦労しました。

このテクノロジーが現在モバイルプラットフォームに存在するかどうか疑問に思います。

電話を使って人の声やフレーズを録音したい。次に、音声に基づいて、別の人がテキストを入力して音声データを取得できるようにします。できれば、同じ単語を使用しないと同時に、目的のフレーズを生成するために必要な正しい音節をキャプチャするためのフレーズを与えます。基本的にはテキスト読み上げですが、ミッションインポッシブル2のようなリアルタイム入力です。たとえば、兄が私に電話をかけ、彼の声を録音してから、母に電話をかけ、兄のように聞こえます。ただし、音楽ファイルのように声をつなぎ合わせるのではなく、言いたいことを入力してください。おそらく、機械的に聞こえないものです。

うまくいけば、私の説明が理にかなっていて、どんな助けでも大いに活用されるでしょう。

ありがとう、ウィル

score 1 · Accepted Answer

あなたが探しているこの機能は「音声変換」と呼ばれます。現在の技術は、ある人の声を別の人のように聞こえるように適応させることができます。適応を行うには、ターゲット音声の約 30 文を録音するだけで十分です。おそらくテキストから合成する必要はありません。他の人の声から音声を変換する方が簡単です。

このテクノロジーのデモがあります。たとえば、Festival を確認してください。

http://festvox.org/transform/transform.html

このテクノロジーの商用プロバイダーについては、確認できます

http://clonevoice.com/en

音声適応を伴う TTS はオープンソースツールでも利用できますが、音声変換よりも複雑なテクノロジです。こちらの話者適応トレーニングを参照してください。

http://hts.sp.nitech.ac.jp/?ダウンロード

score 0 · Accepted Answer

テキスト読み上げエンジンは、可能なすべての音節のクリップがある、事前に録音された音声オーディオのデータベースを使用します。兄弟にすべての音節を録音させない限り、彼の声を合成することはできません。

speech-recognition - テキスト読み上げ、音声合成、Re：できますか？

2 に答える 2

Related

Reference