0

Webサイトに音声認識を実装したいプロジェクトがあります。ユーザーがビデオ電話をかけていると想像してみてください。また、ハンズフリーで対話することもできません。一部のキーワード(「スナップショット」や「メニュー」など)のみを認識できれば十分です。

Chrome(x-webkit-speech)で動作するようになりましたが、IE8で動作する必要があります。

その他の条件:

  • 可能であれば、音声録音は常に行う必要があります(ホームページを開いた直後)。したがって、ユーザーが他の人と話している場合でも、キーワードを聞いた場合は反応するはずです。ボタンを押して録音を開始するSIRIのようなものは必要ありません
  • 電話は非常に機密です。私がこれを行っている会社は、会話全体をGoogleに送信することを望んでいません。そこでは、会話全体を分析してコンテンツを保存できる可能性があります。

誰かが私に完全な解決策を与えることを期待していませんが、私はこれに本当に慣れておらず、急いでいるので、誰かが私を正しい方向に向けることができれば幸いです:)

ありがとうございました!

4

1 に答える 1

0

私は自分の質問に出くわしました...これが私の解決策です:

フラッシュで音を録音しました。.wav に変換しました。ac#-server のソケットに接続し、ファイルを bytearray として送信します。問題: バイトしか受信していないため、クライアントは最初にサイズを送信し、何らかの文字で終了する必要があるため、いつ終了するかがわかります。ランダムな文字を取り、それで wav ファイルを終了することはできません。サイズの拳を取得しないと、送信がいつ完了するかわかりません。

c# サーバーは .NET 4 で実行されました。音声認識があります。.wav ファイルを分析し、文字列をクライアントに送り返します。flash は javascript でメソッドを呼び出すことができます => 問題は解決しました!

もちろん、これは非常に醜いものですが、私たちの顧客はそれでも非常に満足していました。

于 2012-09-26T12:51:18.340 に答える