google-cloud-platform - 空の結果を返すGoogle Cloud Speech API

Question

私は Chromium Google Speech API を使用しており、最近 Google Cloud Speech API の使用に切り替えました。Google Cloud Speech API が発表されて以来、認識精度の面でパフォーマンスが低下しているようです。また、ストリーミングされたオーディオに対して返される「空の結果」がますます増えていることもわかります。

オーディオを複数の異なるサービスに同時にストリーミングしていますが、Google Cloud Speech API は空の結果を返していますが、他のサービスの一部は文字起こしされたテキストを返しています。Chromium Speech API と Google Cloud Speech API の動作に何か変更があるのでしょうか?

音声のヘッダーが適切であることを確認し、音声を Google にストリーミングしていることを確認しました。

Google が時々 (ほとんどの場合) 空の結果を返すことを経験している人はいますか?

score 3 · Accepted Answer

このタイプの質問は、正確なエラーを再現するために詳細が必要になるため、Public Issue Tracker に適しています。このフォームに必要な情報を入力するか、少なくとも問題を明確に示すコードの最小限の動作例を入力してください。正確に再現するには、実行してエラーを返したサンプルコードまたはコマンドと、ストリーミングしたオーディオファイルの構成ファイルおよび URI (またはファイル) と一緒に空の結果を返すことが重要です。

実際のところ、現在ベータ版の音声 API には既知の問題が存在するため、文字起こしが正しく機能しない可能性があります。それまでの間、次のドキュメントを参照して、お客様のケースにベストプラクティスが適用されるかどうかを判断してください。

score 1 · Accepted Answer

私も空の応答を受け取っていましたが、最終的には異なる設定でエンコードすることで結果が得られました.

sox async.wav -t raw --channels=1 --bits=16 --rate=16000 --encoding=signed-integer --endian=little async.raw

google-cloud-platform - 空の結果を返すGoogle Cloud Speech API

3 に答える 3

Related

Reference