0

私は .opus オーディオ ファイルを Google の音声テキスト変換 API に渡しています。次の構成を使用しています。

  • encoding = enums.RecognitionConfig.AudioEncoding.OGG_OPUS
  • language_code = "en-US"
  • サンプルレートヘルツ = 16000

次のエラーが表示されます。

google.api_core.exceptions.GoogleAPICallError: None Unable to recognize speech, possible error in encoding or channel config. Please correct the config and retry the request.

FLAC や LINEAR16 などの他のエンコーディングを試してみましたが、出力として None が得られました。

opus オーディオ ファイルには追加の構成フィールドが必要で、構成ファイルはどのように表示されますか?

4

1 に答える 1