私のiPhoneアプリケーションでは、テキストライブラリへの音声認識が必要です。誰かが私に解決策を提案できますか?2日後に私が見つけたのは、Googleの音声認識APIとオープンソースのOpenEarsライブラリです。誰かがこれらの1つを提案できますか?
3 に答える
Google API が公共の使用を意図しているとは思いません。これらは、Android および Chrome 向けに Google がホストするサービスです。人々は API をリバース エンジニアリングし、いくつかのライブラリを構築して人々が使用できるようにしましたが、私はそれに依存する商用アプリケーションを構築しません (もちろん、それが Android または Chrome アプリケーションでない限り)。
iPhone については、Apple が次の OS アップデートで Siri または Nuance テクノロジーを公開することを大いに期待しています。噂はありましたが、発表はありませんでした。http://techcrunch.com/2011/05/06/apple-nuance-ios-siri/を参照してください。
iphone については、 Nuance、iSpeech、Yapmeなどについて話している人がいることを知っています。
いくつかの背景について、さまざまな SO の質問を紹介します。たくさんありますが、これは役立つかもしれません - Text-to-speech (音声生成) および speech-to-text (音声認識) API?
Google Speech APIは優れていますが、100 文字に制限されています。ですから、短い文章だけを使用すれば問題ありません。
OpenEarsは大規模なライブラリ (400 以上のソース ファイル) であるため、実装するには少し不便かもしれません。
残念ながら、最善の解決策は通常有料の解決策です...
さまざまな有料ソリューションを詳細に検討した結果、http://www.loquendo.com/en/ (現在の Nuance) にたどり着きました。これは良い選択肢だと思います。理解を深めるためにレビューが必要です。