ios - 音声サンプルのイントネーションをグラフ化するにはどうすればよいですか？

Question

ユーザーが読み込んだ音声サンプルのイントネーション（声の高さの上下）をグラフ化できるiOSアプリを作りたいと思っています。イントネーションは世界中のさまざまな言語で非常に重要であり、これは発音だけでなくイントネーションも練習する試みです。

私は音声/音声技術の世界にあまり精通していないので、何が必要ですか？音声サンプルから必要なデータにアクセスする機能を提供するCocoa-touchがインストールされているライブラリはありますか？正確には何をキャプチャしようとしていますか？

私が活用する必要のあるテクノロジーについて誰かが知っているなら、正しい方向へのポイントをいただければ幸いです。

ありがとう！

score 1 · Accepted Answer

あなたが探しているのは、フォルマント分析と呼ばれるものです。

フォルマントは、本質的に、発声された音のスペクトルピークです。それらは、f1、f2 などのように、周波数の順にリストされています。プロットしようとしているのは f1 のようです。

フォルマント分析は音声認識の中核であり、通常、母音を区別するには f1 と f2 で十分です。フォルマント分析アルゴリズムを検索して、そこから取得することをお勧めします。

幸運を：）

1 に答える 1