私は .opus オーディオ ファイルを Google の音声テキスト変換 API に渡しています。次の構成を使用しています。
- encoding = enums.RecognitionConfig.AudioEncoding.OGG_OPUS
- language_code = "en-US"
- サンプルレートヘルツ = 16000
次のエラーが表示されます。
google.api_core.exceptions.GoogleAPICallError: None Unable to recognize speech, possible error in encoding or channel config. Please correct the config and retry the request.
FLAC や LINEAR16 などの他のエンコーディングを試してみましたが、出力として None が得られました。
opus オーディオ ファイルには追加の構成フィールドが必要で、構成ファイルはどのように表示されますか?