疑問文を数えるiOSアプリを作りたいです。私は、WH の質問を探します。形式の質問。
私は音声やオーディオ技術の世界にはあまり詳しくありませんが、Google を調べたところ、音声認識 SDK がほとんどないことがわかりました。しかし、イントネーションを検出してグラフ化する方法はまだわかりません。イントネーションまたは感情的な音声認識をサポートする SDK はありますか?
疑問文を数えるiOSアプリを作りたいです。私は、WH の質問を探します。形式の質問。
私は音声やオーディオ技術の世界にはあまり詳しくありませんが、Google を調べたところ、音声認識 SDK がほとんどないことがわかりました。しかし、イントネーションを検出してグラフ化する方法はまだわかりません。イントネーションまたは感情的な音声認識をサポートする SDK はありますか?
私の知る限り、イントネーションも提供するクラウドベースの音声認識 SDK はありません。ピッチ トラッキング ソリューションを検索し、ピッチの輪郭からイントネーションを導き出すことができます。オープンソースのものはlibrosa
、Python のパッケージで利用できます。
https://librosa.org/librosa/generated/librosa.core.piptrack.html
アプリケーションに Python を埋め込むことができない場合は、Flask
またはを使用して REST API で提供するオプションが常にありますfastapi
。