自然言語処理 API である maluuba API ( Malubba Dev Site ) を使用していますが、ユーザーがマイクに向かって発した音を実際のテキストに変換する方法について、ドキュメントのどこにも言及していません。それはCoreAudioができることですか?もしそうなら、それをどのように実装しますか?
質問する
134 次
1 に答える
1
Core Audioには、テキストへの継続的な音声認識を行うものは(現在または公に)ありません。(Siriは、録音されたオーディオ入力の一部を圧縮し、それをAppleまたは以前のNuanceのサーバーに送信して、認識およびクエリへの処理を行うことで機能すると報告されています)。
コアオーディオは、この録音部分に役立ちます。
iOSで音声認識を行おうとするオープンソースプロジェクトは、CMUのPocketSphinxテクノロジーを使用したOpenEarsです。結果の品質に関しては、レポートによって異なります。Nuanceに連絡して、音声認識APIの使用を有料でライセンスできるかどうかを確認することもできます。
于 2013-02-21T03:33:41.433 に答える