1

私はオンライン音声認識の方法を見つけようとしています。たとえば、Googleの音声検索に非常によく似ており、ユーザーはプラグイン/ソフトウェア/フラッシュをインストールする必要がありません。ユーザーは、マイクを接続し、テキストが認識されるように何かを話す必要があります。

私はこのアプローチを考えましたが、これが正しいかどうかはわかりません。入力オーディオストリームを取得し、認識されたtxtをオーディオから出力できるdllを作成しました。ASP.NETリファレンスでこのdllを参照し、さらにユーザー側からサーバーにオーディオファイルをアップロードして、「認識機能」dllを使用することを検討しました。このアプローチが正しいかどうかわかりませんか?私が従うことができる他のアプローチはありますか?
主なことは、フラッシュ/シルバーライトなど、この実装の依存関係をユーザーにインストールさせることができないことです。

4

1 に答える 1

1

ユーザーが Chrome 11 以降を使用するように指定できる場合は、Google の Webkit を使用してアプリケーションを音声認識できるようにすることができます。Webkit for speech の使用方法に関するリンクを次に示します。これは、 HTML5で利用可能なオーディオ入力機能を活用します。このブログを見ると、著者がリバース エンジニアリングを行っているため、その仕組みが説明されています。ブラウザでユーザーからオーディオ入力を取得し、それをサービスに送信して処理し、結果を JSON メッセージとして返します。あなたが提案しているように、サーバー側で独自のサービスを構築して、Google が行っていることを模倣することができます。スケーラブルな音声認識サービスを構築するのは簡単なことではありません。

于 2012-06-29T15:29:23.910 に答える