私は話す漫画の顔を含むopenGLプロジェクトに取り組んでいます。私の希望は、スピーチ (mp3 としてエンコードされたもの) を再生し、音声データを使用してその口をアニメーション化することです。これまでオーディオを実際に扱ったことはなかったので、どこから始めればよいかわかりませんが、グーグルで調べたところ、最初のステップはmp3をpcmに変換することだと思いました。
フーリエ変換が必要になるとはまったく予想していませんが、それはいいことかもしれません。音声があるときは、口が本当に動き回る必要があります(音量に基づいて考えていました)。
このようなものを実装するためのヒントやリソースへのポインタは大歓迎です。ありがとう!
-S