Google の Cloud Speech API を使用しようとしています。ここにドキュメントとコード例があります:
https://cloud.google.com/speech/docs/basics
https://cloud.google.com/speech/docs/rest-tutorial
サンプル コードが含まれているファイル audio.raw を指定すると、サンプル コードを問題なく実行できますが、簡単な .wav ファイルを指定することはできません。
オーディオ サンプル ファイルの形式がわかりません。
$ file audio.raw
audio.raw: data
おそらく 10 秒のオーディオを含む .wav ファイルでは、空の結果が得られます。
私はこの答えを知っています。
空の結果を返すGoogle Cloud Speech API
私の質問は以前に尋ねられましたが、質問に対する回答がありませんでした。
Cloud Speech API でサポートされている音声の種類は何ですか?
これを機能させるために、オーディオ ファイルのプロパティを適切に取得する必要があるとは想像できません。私の一般的なユースケースは、誰かが会議を記録し、記録のパラメータがわからず、テキストファイルだけが欲しいというものだと思います。