4

だから、これはトリッキーです。

ユーザーが言った単語を記録し、サンプルをサーバー側に送信して処理する Web アプリケーションを作成したいと考えています。

私が考えているアルゴリズムは次のとおりです。

  1. ユーザーがボタンをクリックすると、記録セッションが開始されます
  2. ユーザーが 1 つの単語を言うまで待ちます (ユーザーが 1 つの単語を言う必要があることを知っていると仮定します)。
  3. 彼がそう言ったら録音を止める
  4. サンプルをサーバーに送信します。たとえば、HTTP を使用します。
  5. サーバー側でシグナルを処理する
  6. ユーザーに何らかの応答を返します。

Java、C#、および私が推測するその他の高レベル言語には、音声アクティビティ検出のソリューションがいくつかあります。ただし、この部分がクライアント側で行われることを望みます (そうしないと、クライアントからサーバーに大量のデータを送信する必要があり、非常に非効率的です) IE の javascript および HTML5.

私は経験豊富な Web 開発者ではないので、質問は次のとおりです。これは実行可能ですか? そのためのライブラリはありますか(私は見つけていません)?問題にアプローチするための最良のアプローチは何ですか?

4

0 に答える 0