音声認識を使ったアプリを作りたいです。Google などの大企業がこの機能を実装しているのを見てきましたが、スタートアップ レベルで実装することに興味があります。誰かがこれを調べましたか?これを行うためのツールはありますか?
4 に答える
OpenEarsは有望に見えます... http: //www.politepix.com/openears/
ポケットスフィンクスに基づいています。
ここでウィキペディアから始めると、優れたリスト エンジンが得られます ( http://en.wikipedia.org/wiki/Speech_recognition#Commercial_software.2Fmiddleware ) 。
これを書いている時点 (2009 年 6 月 24 日) では、実行可能なオープン ソース ソリューションが 2 つあるように見えます。
- ポケット スフィンクス ( http://www.speech.cs.cmu.edu/pocketsphinx )
- ジュリアス ( http://en.wikipedia.org/wiki/Julius_(software) )
どちらも iPhone アプリで使用されていますが、iPhone 向けのソースはすぐには入手できません。
これを編集しているときに (2009 年 7 月 8 日)、最近 Loquendo ( http://www.loquendo.com/en/ ) が iPhone 用の音声認識と音声合成 (ASR & TTS) を備えていることを知りました。
最善のアプローチは、おそらく次のようになります。
- 電話で声を録音する
- 音声認識ソフトウェアを実行するサーバーに録音を送信します
- 次に、何をすべきかを示すために電話に何かを返します
NuanceのDragonMobileSDKは、求められていることを実行します。Nuanceのサーバーに音声を送信するには、インターネット接続が必要です。テキスト応答のリストを取得できます。次に、テキスト応答をどのように処理するかを決定できます(たとえば、ユーザーに、意図したものを選択するか、何らかのアクションを実行するように依頼します)。リンクは次のとおりです。