speech-recognition - 音声入力を文字列として取得する

Question

ユーザーが VoiceXML アプリケーションで言ったことの文字列表現を取得することは可能ですか? たとえば、データベースクエリで使用します。

これまでに見たほとんどの例は、(xml で) 定義された数の選択肢と照合しようとするだけです。これは、入力を使用して、たとえば 100k エントリを超えるデータベースと照合する場合には適していません。

ありがとう

score 2 · Accepted Answer

音声入力は、最終結果の発話属性を持つ文字列として取得できます ( VoiceXML 仕様)

しかし、それはあなたの問題ではありません。制限のない文法、または 100K エントリを処理できるシステムが必要です。これは、VoiceXML 言語ではなく、認識エンジンの成果物です。理論的には、100K の SRGS 文法を構築できます。実際には、それらがすべて一意の入力であり、明確な定義方法がない場合、おそらく大きすぎます。これは、Nuance などのエンジンを使用したネイティブ文法を使用して、静的リストまたはエントリ、または項目コンポーネントで構成される統計言語モデル (共通のコンポーネントを共有していると仮定) を使用して実行できる場合があります。

ディクテーションエンジンを見ることができます。通常、VoiceXML プラットフォームは通常の VoiceXML のユースケースとうまく連携しておらず、ほとんどのディクテーションエンジンは入力を完全に識別するためにトレーニングと通常の文構造を必要とするため、VoiceXML プラットフォームに関連付けられているものを見たことはないと思います。

speech-recognition - 音声入力を文字列として取得する

1 に答える 1

Related

Reference