「x-webkit-speech」がある種の音声認識を実行できることは知っていますが、実際、その認識はかなり良好です。
「x-webkit-speech」は、質問するだけでシステムが質問を認識して回答する Q&A アプリケーションの開発に適していることがわかりました。
ただし、私が探しているのは、ブラウザで連続音声認識を実行する方法です。たとえば、オンラインで講義を聞いている場合、教授が話していることをリアルタイムで書き起こしたいと思います。
「x-webkit-speech」で可能ですか?私の感じでは、「x-webkit-speech」が短い無音期間を検出すると自動的に停止するのが面倒です。実際にオーディオをflacに変換してGoogleサーバーに送り返すことは知っています。より長い音声を送り返すことは可能ですか? ウェブ上で継続的な音声認識が必要です。