Webサイトに音声認識を実装したいプロジェクトがあります。ユーザーがビデオ電話をかけていると想像してみてください。また、ハンズフリーで対話することもできません。一部のキーワード(「スナップショット」や「メニュー」など)のみを認識できれば十分です。
Chrome(x-webkit-speech)で動作するようになりましたが、IE8で動作する必要があります。
その他の条件:
- 可能であれば、音声録音は常に行う必要があります(ホームページを開いた直後)。したがって、ユーザーが他の人と話している場合でも、キーワードを聞いた場合は反応するはずです。ボタンを押して録音を開始するSIRIのようなものは必要ありません
- 電話は非常に機密です。私がこれを行っている会社は、会話全体をGoogleに送信することを望んでいません。そこでは、会話全体を分析してコンテンツを保存できる可能性があります。
誰かが私に完全な解決策を与えることを期待していませんが、私はこれに本当に慣れておらず、急いでいるので、誰かが私を正しい方向に向けることができれば幸いです:)
ありがとうございました!