python - Google Speech API 非同期リクエスト応答を取得するには?

Question

非同期の google-speech-api リクエストを機能させようとしています。アドバイスに従って、play次のコマンドを使用します。

play audio2min.flac

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/api-clientのコードを使用します。次に、対応するエンコーディングでリクエストを適応させます。

次に、エラーが発生します。

"Audio 'content' cannot be longer than 1 min.
For long audio, use the 'uri' parameter to specify a file."

次に、ファイルをGoogleストレージに置き、リクエストを適応させます"uri": "gs://path/to/my/audio2min.flac"

しかし、その後、エラーが発生します:

For audio inputs longer than 1 min, please use LINEAR16 encoding.

問題は次のとおりです。FLAC の代わりに LINEAR16 のエンコーディングを変更すると、無効な回答が得られます。

エンコーディングが本当に問題であることを確認するために、同期要求を含むファイルから 30 秒のサンプルを試しました。FLAC のエンコードでは機能しましたが、LINEAR16 のエンコードでは機能しませんでした。

ここからどうすればいいのか誰か説明してもらえますか?

score 0 · Accepted Answer

ファイルのエンコーディングを変更することで、ようやく機能させることができました。

other uncompressed files

ヘッダー:RAW

エンコーディング:16-bit PCM

これで動作するはずです

1 に答える 1