Google Cloud Console でプロジェクトを作成し、このプロジェクトで Google Speech API を有効にして、資格情報を作成しました。また、Google が推奨する transcribe.py を使用し、
https://cloud.google.com/speech/docs/samples
https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech
Google によって生成された API キーを使用して、音声ファイル (30 秒) をテキストに正常に変換できますが、最初の 2 ~ 3 秒だけを完全に変換することはできません。私のアカウントは現在無料トライアル中なので、アカウントの種類(無料トライアル)のせいなのか疑問です。
Google からの応答は次のようになります}]}]}
音声ファイルは wav ファイル形式 (ffprobe で出力) ストリーム #0:0: 音声: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, 1 チャンネル, s16, 256 kb/ s
オーディオ ファイルが Google ドライブにアップロードされました。リンクはこちら https://drive.google.com/file/d/0B3koIsnLksOLQXhvQ1ljS0dDXzg/view?usp=sharing
上記のプロセス/手順の何が問題なのか知っている人はいますか? または、これは Google 音声認識 API のバグですか?