声の音素を取得したい。このために、Praat を使用するように提案されました。http://www.fon.hum.uva.nl/praat/
Praatを使用してこれを行うことは可能ですか? これにどのようにアプローチすればよいですか?
私はすでにリアルタイムで音声をテキストに変換しています。私が必要としているのは、別の場所から話している別の人の声に合わせてロボットの唇を動かすことです。このためには、声の音素または口形素が必要です。(音声をテキストに変換してから音素に変換したくありません)。Voice to Phonemes が必要です。
または、これを行うために利用できる他のより良いツールはありますか?