0

非同期の google-speech-api リクエストを機能させようとしています。アドバイスに従って、play次のコマンドを使用します。

play audio2min.flac

ここに画像の説明を入力

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/api-clientのコードを使用します。次に、対応するエンコーディングでリクエストを適応させます。

次に、エラーが発生します。

"Audio 'content' cannot be longer than 1 min.
For long audio, use the 'uri' parameter to specify a file."

次に、ファイルをGoogleストレージに置き、リクエストを適応させます"uri": "gs://path/to/my/audio2min.flac"

しかし、その後、エラーが発生します:

For audio inputs longer than 1 min, please use LINEAR16 encoding.

問題は次のとおりです。FLAC の代わりに LINEAR16 のエンコーディングを変更すると、無効な回答が得られます。

エンコーディングが本当に問題であることを確認するために、同期要求を含むファイルから 30 秒のサンプルを試しました。FLAC のエンコードでは機能しましたが、LINEAR16 のエンコードでは機能しませんでした。

ここからどうすればいいのか誰か説明してもらえますか?

4

1 に答える 1

0

ファイルのエンコーディングを変更することで、ようやく機能させることができました。

  1. audacity をダウンロード: http://www.audacityteam.org/

  2. ファイルを開く

  3. ファイル内 -> オーディオのエクスポート -> 選択:

other uncompressed files

ヘッダー:RAW

エンコーディング:16-bit PCM

ここに画像の説明を入力

これで動作するはずです

于 2016-11-13T15:03:39.270 に答える