だから、これはトリッキーです。
ユーザーが言った単語を記録し、サンプルをサーバー側に送信して処理する Web アプリケーションを作成したいと考えています。
私が考えているアルゴリズムは次のとおりです。
- ユーザーがボタンをクリックすると、記録セッションが開始されます
- ユーザーが 1 つの単語を言うまで待ちます (ユーザーが 1 つの単語を言う必要があることを知っていると仮定します)。
- 彼がそう言ったら録音を止める
- サンプルをサーバーに送信します。たとえば、HTTP を使用します。
- サーバー側でシグナルを処理する
- ユーザーに何らかの応答を返します。
Java、C#、および私が推測するその他の高レベル言語には、音声アクティビティ検出のソリューションがいくつかあります。ただし、この部分がクライアント側で行われることを望みます (そうしないと、クライアントからサーバーに大量のデータを送信する必要があり、非常に非効率的です) IE の javascript および HTML5.
私は経験豊富な Web 開発者ではないので、質問は次のとおりです。これは実行可能ですか? そのためのライブラリはありますか(私は見つけていません)?問題にアプローチするための最良のアプローチは何ですか?