HTML5's x-webkit-speech
サーバー側で音声認識を実装する方法 ( javascript などを提案しないでください) ? プログラムはオーディオ ファイルを入力として受け取り、十分な精度でオーディオ ファイルのテキスト トランスクリプションを提供します。使用できるオプションは何ですか?
VoxforgeモデルでSphin4を実装しようとしましたが、精度が非常に悪いです(私の設定にも問題がある可能性があります.私はまだそれを学ぼうとしています). ある投稿で<input name="speech" id="speech" type="text" x-webkit-speech />
、入力を使用すると外部サーバーに送信され、そのサーバーが認識を行い、データをブラウザーに送り返すことを読みました。
そのサーバーをどのようにセットアップできますか? 最小限のエラー率で英語の文章を認識できれば、既存のオープン ソース サーバーも役に立ちます。