2

ユーザーが読み込んだ音声サンプルのイントネーション(声の高さの上下)をグラフ化できるiOSアプリを作りたいと思っています。イントネーションは世界中のさまざまな言語で非常に重要であり、これは発音だけでなくイントネーションも練習する試みです。

私は音声/音声技術の世界にあまり精通していないので、何が必要ですか?音声サンプルから必要なデータにアクセスする機能を提供するCocoa-touchがインストールされているライブラリはありますか?正確には何をキャプチャしようとしていますか?

私が活用する必要のあるテクノロジーについて誰かが知っているなら、正しい方向へのポイントをいただければ幸いです。

ありがとう!

4

1 に答える 1

1

あなたが探しているのは、フォルマント分析と呼ばれるものです。

フォルマントは、本質的に、発声された音のスペクトルピークです。それらは、f1、f2 などのように、周波数の順にリストされています。プロットしようとしているのは f1 のようです。

フォルマント分析は音声認識の中核であり、通常、母音を区別するには f1 と f2 で十分です。フォルマント分析アルゴリズムを検索して、そこから取得することをお勧めします。

幸運を :)

于 2012-08-30T06:15:03.247 に答える