speech-to-text - .opus オーディオファイルの場合、Google の音声からテキストへの構成はどのように見えますか

質問する 2020-08-06T00:14:51.830

178 次

私は .opus オーディオファイルを Google の音声テキスト変換 API に渡しています。次の構成を使用しています。

encoding = enums.RecognitionConfig.AudioEncoding.OGG_OPUS
language_code = "en-US"
サンプルレートヘルツ = 16000

次のエラーが表示されます。

google.api_core.exceptions.GoogleAPICallError: None Unable to recognize speech, possible error in encoding or channel config. Please correct the config and retry the request.

FLAC や LINEAR16 などの他のエンコーディングを試してみましたが、出力として None が得られました。

opus オーディオファイルには追加の構成フィールドが必要で、構成ファイルはどのように表示されますか?

speech-to-text - .opus オーディオ ファイルの場合、Google の音声からテキストへの構成はどのように見えますか

1 に答える 1

Related

Reference

speech-to-text - .opus オーディオファイルの場合、Google の音声からテキストへの構成はどのように見えますか