audio - Google Cloud Speech API が認識する音声ファイルの種類は何ですか?

翻译自：https://stackoverflow.com/questions/40060458 2016-10-15T14:49:40.607

11550 次

Google の Cloud Speech API を使用しようとしています。ここにドキュメントとコード例があります：

https://cloud.google.com/speech/docs/basics
https://cloud.google.com/speech/docs/rest-tutorial

サンプルコードが含まれているファイル audio.raw を指定すると、サンプルコードを問題なく実行できますが、簡単な .wav ファイルを指定することはできません。

オーディオサンプルファイルの形式がわかりません。

$ file audio.raw 
audio.raw: data

おそらく 10 秒のオーディオを含む .wav ファイルでは、空の結果が得られます。

私はこの答えを知っています。

私の質問は以前に尋ねられましたが、質問に対する回答がありませんでした。

これを機能させるために、オーディオファイルのプロパティを適切に取得する必要があるとは想像できません。私の一般的なユースケースは、誰かが会議を記録し、記録のパラメータがわからず、テキストファイルだけが欲しいというものだと思います。

2 に答える 2