4

私は自分のアプリケーション用のカスタム音声エンジンを作成する必要があるプロジェクトに取り組んでいます。TTS Builderのようなものを見たことがありますが、TTS Builderなどのアプリケーションがどのように開発されているかを理解している人はいますか?SAPIエンジンの背後にあるものは何ですか?それらはどのように機能しますか?どうすれば自分で作ることができますか?独自のアルゴリズムを開発できますか?可能であれば、C#でこれを実行したいと思います

4

1 に答える 1

3

私が見るところ、TTS Builderは既存のボイスを使用し、マイナーなパラメーターを微調整してわずかに異なるサウンドのボイスを作成できるように見えます。しかし、アクセントや発音が異なる声を作成するのはもっと複雑だと思います。

AT&T Researchから:

高品質の声を作成するには、優れた声優、防音室、プロのオーディオ機器、言語の音素の組み合わせを完全にカバーする何時間もの書面、およびそれらの録音を適切な合成音声に変換するための時間と専門知識が必要です。費用がかかるため、カスタムボイスビルドは通常、既存の俳優の声をコンピューター化したい企業向けに行われます。たとえば、ブランドイメージを継続するためです。
...
TTS音声を最初から作成するよりも、変換モデルを作成する方がはるかに少ない材料で済みます。

于 2011-04-23T04:13:39.063 に答える