6

私は Chromium Google Speech API を使用しており、最近 Google Cloud Speech API の使用に切り替えました。Google Cloud Speech API が発表されて以来、認識精度の面でパフォーマンスが低下しているようです。また、ストリーミングされたオーディオに対して返される「空の結果」がますます増えていることもわかります。

オーディオを複数の異なるサービスに同時にストリーミングしていますが、Google Cloud Speech API は空の結果を返していますが、他のサービスの一部は文字起こしされたテキストを返しています。Chromium Speech API と Google Cloud Speech API の動作に何か変更があるのでしょうか?

音声のヘッダーが適切であることを確認し、音声を Google にストリーミングしていることを確認しました。

Google が時々 (ほとんどの場合) 空の結果を返すことを経験している人はいますか?

4

3 に答える 3

3

このタイプの質問は、正確なエラーを再現するために詳細が必要になるため、Public Issue Tracker に適しています。このフォームに必要な情報を入力するか、少なくとも問題を明確に示すコードの最小限の動作例を入力してください。正確に再現するには、実行してエラーを返したサンプル コードまたはコマンドと、ストリーミングしたオーディオ ファイルの構成ファイルおよび URI (またはファイル) と一緒に空の結果を返すことが重要です。

実際のところ、現在ベータ版の音声 API には既知の問題が存在するため、文字起こしが正しく機能しない可能性があります。それまでの間、次のドキュメントを参照して、お客様のケースにベスト プラクティスが適用されるかどうかを判断してください。

于 2016-10-06T22:04:54.980 に答える
1

私も空の応答を受け取っていましたが、最終的には異なる設定でエンコードすることで結果が得られました.

sox async.wav -t raw --channels=1 --bits=16 --rate=16000 --encoding=signed-integer --endian=little async.raw

于 2016-11-04T03:25:22.507 に答える