私は、HMM ベースのアプローチを使用してローカル言語のシンセサイザーを構築するプロジェクトに取り組んでいます。これまでのところ、HTK Book で説明されているように、強制アライメント ファイル (aligned.mlf) を生成できました。ただし、HTS を使用してシンセサイザーを構築する方法についての段階的な手順を見つけることができません。私が行ったことは、HTS Web サイトでサンプル Speaker Dependent Demo をダウンロードし、そのデータをトレーニングすることです。音声フォルダーにあるのはcmu_us_arctic_slt.htsvoice
ファイルです。したがって、私の2部構成の質問は次のとおりです。
1) このファイルを Festival の音声として使用するにはどうすればよいですか?
2)持っている強制アラインメント ファイルから、自分の声をトレーニングするために必要なファイルを生成するlabel
にはどうすればよいですか?utt
どんな助けでも大歓迎です。ありがとう。