0

私はこのシナリオに興味があります。Web アプリケーションを構築していて、音声コマンドを受け取り、音声テキスト変換の結果に基づいてアクションを実行するとします。

そうでなければ、これをキラーアプリケーションにする可能性のある主要な障害はありますか?

4

2 に答える 2

0

私が最初に考えることができるのは、送信されるオーディオの品質は、ユーザーのアップロード帯域幅に大きく依存する可能性があるということです。帯域幅が狭くなるほど、品質が低下し、音声からテキストへのアルゴリズムが正確に話されていることを検出できなくなります。

于 2009-07-18T21:31:06.593 に答える
0

低サンプル オーディオは、s2t アルゴリズムに使用できます。私の問題:

  1. オーディオをサーバーに送信して処理する (フラッシュまたは Java など)
  2. 必要なアクションをクライアントにポーリングさせる
  3. これをバックエンドでスケーラブルにする
  4. インターネットがサポートする幅広い言語、方言、抑揚、アクセントに対応
  5. 邪魔にならず、使用可能なフォールバックが利用可能であることを確認する
  6. ユーザビリティ担当者からの苦情への対応

確かにもっとたくさんありますが、それ以外は試してください。

人々が「私たちは月に行く」と言ってそれをしなければ、私たちはどこにいるでしょう。頑張れ ...

まだ行っていない場合は、失敗または成功した場合、おそらく何かクールなことを学ぶことができます.

于 2009-07-18T21:35:57.787 に答える