Web ブラウザ インターフェイスを介してオンライン音声認識を実装する方法。
Streaming Server (完全にブラウザベースのアプリケーション) を使用せずにこれを実装することは可能ですか? 独自のプラグインを作成せずに、Flash を使用して音声認識を実装することは可能ですか...
Web ブラウザ インターフェイスを介してオンライン音声認識を実装する方法。
Streaming Server (完全にブラウザベースのアプリケーション) を使用せずにこれを実装することは可能ですか? 独自のプラグインを作成せずに、Flash を使用して音声認識を実装することは可能ですか...
オーディオ キャプチャの HTML サポートがあるとは思えません。http://www.w3.org/TR/xhtml+voice/を作成したワーキング グループがありますが、これが Opera 以外のブラウザに実装されているとは思えません ( http://dev.opera.com/articlesを参照)。 /声/)。
WAMI ツールキットを見ることができます。WAMI ツールキットは MIT の興味深いプロジェクトです - http://wami.csail.mit.edu/。彼ら自身の言葉を借りれば、「WAMI: Web アクセス可能なマルチモーダル アプリケーション。WAMI は、任意の Web ページに音声認識機能を追加する簡単な方法です。」WAMI は、Web ページで実行して音声認識用のオーディオ キャプチャを実行できる Java アプレットを提供します。それらの例では、認識はサーバー上で実行されます。
ブラウザー内で Flash、ActiveX、または Java を使用して、Web ページ内からローカル音声認識を実行できるのではないかと思います。ただし、認識エンジンをインストールする (または使用できることを確認する) 必要があります。
私はそれが可能だとは思いません。Flash を使用すると、確かにユーザーのマイクからオーディオをキャプチャできますが、現時点では WebKit 以外でブラウザ レベルの認識を提供するものはありません。
サイドノート:
現在、HTML5 仕様の一部としてx-webkit-speech
、要素に追加できる属性があります<input>
。Google 翻訳でこれを実際に見たことがあるかもしれません。これは、Flash 以外で利用できる最良のオプションのようです。
http://caniuse.com/#feat=audio-apiを見つけて、閉じられた質問に関するこのコメントから何が可能かを追跡しました。
pocketphinx は機能しますが、数単語以上を処理するには十分ではなく、精度も低くなります。CSharp は優れていますが、Web ページ内に展開するのは簡単ではありません。優れたサービスにはリモート サーバー (Bing API、Google API など) が必要です。