私はこのシナリオに興味があります。Web アプリケーションを構築していて、音声コマンドを受け取り、音声テキスト変換の結果に基づいてアクションを実行するとします。
そうでなければ、これをキラーアプリケーションにする可能性のある主要な障害はありますか?
私はこのシナリオに興味があります。Web アプリケーションを構築していて、音声コマンドを受け取り、音声テキスト変換の結果に基づいてアクションを実行するとします。
そうでなければ、これをキラーアプリケーションにする可能性のある主要な障害はありますか?
私が最初に考えることができるのは、送信されるオーディオの品質は、ユーザーのアップロード帯域幅に大きく依存する可能性があるということです。帯域幅が狭くなるほど、品質が低下し、音声からテキストへのアルゴリズムが正確に話されていることを検出できなくなります。
低サンプル オーディオは、s2t アルゴリズムに使用できます。私の問題:
確かにもっとたくさんありますが、それ以外は試してください。
人々が「私たちは月に行く」と言ってそれをしなければ、私たちはどこにいるでしょうか。頑張れ ...
まだ行っていない場合は、失敗または成功した場合、おそらく何かクールなことを学ぶことができます.