Google が開発者向けの公式音声 API をついにリリースしたことを知ったとき、私は非常に興奮しました。私は、Google の音声認識が Android、Chrome、およびその他の製品でどれほど優れているかに常に驚かされてきました。
Google Cloud アカウントを作成し、Speech API を有効にして、Google Speech API のドキュメントに従っていくつかのテスト スクリプトを作成しました。精度は超高いが、速度はめちゃくちゃ遅い。18 秒の音声ファイルの文字起こしには、エンジンで約 16 秒かかります。Microsoft Bing Speech API は 3 ~ 4 秒しかかかりません。
誰も同じことを経験しましたか?それとも私の設定の問題ですか?どんな助けでも大歓迎です!
使用したコードは次のとおりです。
バッシュ:
time curl "https://speech.googleapis.com/v1beta1/speech:syncrecognize?key={MY_API_KEY}" --header "Content-Type: application/json" --data '{"config":{"encoding":"FLAC","sample_rate":16000,"language_code":"en-US"},"audio":{"uri":"gs://accobot-speech/new_record.flac"}}'