1

ユーザーが VoiceXML アプリケーションで言ったことの文字列表現を取得することは可能ですか? たとえば、データベース クエリで使用します。

これまでに見たほとんどの例は、(xml で) 定義された数の選択肢と照合しようとするだけです。これは、入力を使用して、たとえば 100k エントリを超えるデータベースと照合する場合には適していません。

ありがとう

4

1 に答える 1

2

音声入力は、最終結果の発話属性を持つ文字列として取得できます ( VoiceXML 仕様)

しかし、それはあなたの問題ではありません。制限のない文法、または 100K エントリを処理できるシステムが必要です。これは、VoiceXML 言語ではなく、認識エンジンの成果物です。理論的には、100K の SRGS 文法を構築できます。実際には、それらがすべて一意の入力であり、明確な定義方法がない場合、おそらく大きすぎます。これは、Nuance などのエンジンを使用したネイティブ文法を使用して、静的リストまたはエントリ、または項目コンポーネントで構成される統計言語モデル (共通のコンポーネントを共有していると仮定) を使用して実行できる場合があります。

ディクテーションエンジンを見ることができます。通常、VoiceXML プラットフォームは通常の VoiceXML のユース ケースとうまく連携しておらず、ほとんどのディクテーション エンジンは入力を完全に識別するためにトレーニングと通常の文構造を必要とするため、VoiceXML プラットフォームに関連付けられているものを見たことはないと思います。

于 2010-12-11T16:14:28.477 に答える