Flash で音声認識を使用する方法を探していたときに、VoiceXML に出会いました。私はそれについての W3C の説明を調べましたが、それでもいくつかの大きな疑問があります。
vxml ドキュメントを作成して Web サーバーに配置することはできますか? 要件は何ですか?
それはうまくいきますか?
インターネット経由でマイク入力はできますか?
私はそれに対する直接的な答えを見つけることができないようです。
Flash で音声認識を使用する方法を探していたときに、VoiceXML に出会いました。私はそれについての W3C の説明を調べましたが、それでもいくつかの大きな疑問があります。
vxml ドキュメントを作成して Web サーバーに配置することはできますか? 要件は何ですか?
それはうまくいきますか?
インターネット経由でマイク入力はできますか?
私はそれに対する直接的な答えを見つけることができないようです。
VoiceXMLの処理方法を知っているブラウザに相当するものが必要です。
私は電気通信業界で働いているので、通常、古いスタイルの電話接続の1つまたはVoIPを介して公衆電話網に接続するソフトウェアを意味します。この分野には多くの商用ソリューションといくつかのオープンソースソリューションがあります。
Operaやアクセシビリティ分野でのいくつかの研究イニシアチブのような他のいくつかの実装がありますが、私はそれらが多くの根拠を集めるのを見ていません。
私はVoiceXMLを音声認識にアプローチする最も簡単な方法とは見なしません。とはいえ、簡単な方法も、多くのフリー/オープンソースソリューションもありません。Microsoftプラットフォームでの最も簡単な方法は、MicrosoftのSAPIレイヤーと、それらが提供する無料の最小限のASRを確認することです。Linux側では、 CMUSphinxをチェックしてください。
VoiceXML は、音声 (通常は電話) で配信されるコンテンツをマークアップする方法です。HTML が Web ブラウザーに表示するコンテンツをフォーマットする方法であるのと同様に、VoiceXML はそれを電話に配信する方法です。
VoiceXML 自体は音声認識を行いません。しかし、VoiceXML プロバイダーの多くは、VoiceXML プラットフォームに音声認識 (ASR とも呼ばれます) エンジンもバンドルしています。
コンピューターのマイクから何らかのデスクトップ アプリケーションに送られる音声入力を認識する方法を探している場合、VoiceXML はおそらく探しているものではありません。
ウィキペディアには、 http://en.wikipedia.org/wiki/List_of_speech_recognition_softwareにいくつかの音声認識ソフトウェアのリストがあります。
VoiceXML についてさらに詳しく知りたい場合は、 http: //vxml.org/に優れたドキュメントがあります。