17

私はウェブ音声認識に取り組んでいます。

そして、Google が開発者向けに「Google speech API V2」を呼び出す API を提供していることがわかりました。でも、毎日使うには限界があることに気づきました。

その後、音声認識を実装できるネイティブの WEB Speech API があることがわかりました。そして、それはGoogle ChromeとOperaで動作しています:

http://caniuse.com/#feat=音声認識

1. Google Speech API と Web Speech API の違いは何ですか? 彼らは何か関係がありますか?

  1. 音声認識結果のjsonはgoogleから返ってきます。Google の音声 API は Web の音声 API よりも正確ですか?

ありがとうございました。

4

2 に答える 2

21

Web Speech APIはW3C でサポートされている仕様であり、ブラウザー ベンダーは、API の制限を心配することなく、ブラウザーから直接使用できる API をサポートする、選択した音声認識エンジン (ローカルまたはクラウド ベース) を提供できます。など。Apple は Siri でこれを強化し、Microsoft は Cortana でこれを強化する可能性があると想像できます。繰り返しになりますが、ブラウザー ベンダーは、オペレーティング システムに組み込まれているディクテーション ソフトウェアを使用することを選択できますが、それは現在の傾向ではないようです。ブラウザーで単純な音声合成を実行しようとしている場合 (音声コマンドなど)、特に普及が進んでいる場合は、これが最良の方法となる可能性があります。

Google Speech APIは、ブラウザーの外部で Google の音声ソフトウェアを使用できるようにするクラウドベースのソリューションです。また、より広い言語サポートを提供し、より長い音声ファイルを書き起こすことができます。書き起こしたい 20 分間の音声録音がある場合、これが進むべき道です。この記事の執筆時点では、Google はこのサービスの最初の 1 時間後に記録された 15 秒ごとに 0.006 ドルを請求しています。

于 2016-10-07T20:56:23.863 に答える