問題タブ [google-cloud-speech]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
6908 参照

flac - Google クラウドの音声同期は「INVALID_ARGUMENT」を認識します

「概要チュートリアル」を管理しました: https://cloud.google.com/speech/docs/getting-started 次に、自分のオーディオ ファイルを使用しようとしました。サンプルレート 16000Hz の .flac ファイルをアップロードしました。

以下のファイルは、Google クラウド ストレージ ( )sync-request.jsonでホストされている自分のオーディオ ファイルに変更しただけです。gs://my-bucket/test4.flac

ファイルは十分に認識されていますが、リクエストは「INVALID_ARGUMENT」エラーを返します

0 投票する
3 に答える
3126 参照

google-cloud-platform - 空の結果を返すGoogle Cloud Speech API

私は Chromium Google Speech API を使用しており、最近 Google Cloud Speech API の使用に切り替えました。Google Cloud Speech API が発表されて以来、認識精度の面でパフォーマンスが低下しているようです。また、ストリーミングされたオーディオに対して返される「空の結果」がますます増えていることもわかります。

オーディオを複数の異なるサービスに同時にストリーミングしていますが、Google Cloud Speech API は空の結果を返していますが、他のサービスの一部は文字起こしされたテキストを返しています。Chromium Speech API と Google Cloud Speech API の動作に何か変更があるのでしょうか?

音声のヘッダーが適切であることを確認し、音声を Google にストリーミングしていることを確認しました。

Google が時々 (ほとんどの場合) 空の結果を返すことを経験している人はいますか?

0 投票する
1 に答える
782 参照

android - Google Cloud Speech API が UNAVAILABLE: Channel in TRANSIENT_FAILURE 状態を Android に与える

しばらくGoogle Cloud Speech APIを使用しています。私は具体的には、Googleが提供するGoogle Speech Demoに従っています。バージョン 5.0 以降のデバイスでは、非常に効率的に動作しています。

しかし、Android 5.0 より前のバージョンで実行すると、常に

UNAVAILABLE: TRANSIENT_FAILURE 状態のチャネル

検索したところ、Google API の正規のエラー コードがいくつか見つかりました。

UNAVAILABLE サービスは現在利用できません。これは一時的な状態である可能性が高く、バックオフを使用して再試行することで修正できます。

FAILED_PRECONDITION、ABORTED、および UNAVAILABLE の決定については、上記のガイドラインを参照してください。

HTTP マッピング: 503 サービスを利用できません

ということは、Android 5.0 より前の Android デバイスでは Cloud Speech Services がサポートされていないということですか? これに回避策はありますか?

0 投票する
1 に答える
1609 参照

java - Cloud Speech API リターン コード = UNAUTHENTICATED、原因 =java.io.IOException: サービス アカウントのアクセス トークンの取得中にエラーが発生しました:

アプリでの音声認識に Google Cloud Speech API (gRPC 経由の StreamingRecognize) を使用しています。Android デバイス API レベル < 23 での認証に問題がありました。

毎回このエラーが発生するわけではありませんが、特定の場合にのみ発生します。私は2つの活動をしています。AとBに名前を付けましょう。

アクティビティ A には、アクティビティ B を開始するボタンがあります。アクティビティ B は Google Cloud Speech API と通信し、結果を TextView に表示します。

次の手順の後にこのエラーが発生します(Samsung GT-P5110 (Android 4.2.2)):

  1. アクティビティ A を開始 -> ボタンを押してアクティビティ B を開始します。

// 最初はすべて問題ありません。サーバーから結果を受け取り、これを表示します。

  1. アクティビティ B を閉じます ([戻る] ボタンを押すか、onBackPressed を呼び出すか、終了します)。

  2. ボタンを押して、アクティビティ B を開始します。

// この時点で、上に示したエラーが発生します。

Lenovo A1000 (API 5.0.1) および Xiaomi Mi4c (5.0.1) で次のエラーが発生します。

  1. アクティビティ A を開始 -> ボタンを押してアクティビティ B を開始します。

  2. アクティビティ B を閉じます ([戻る] ボタンを押すか、onBackPressed を呼び出すか、終了します)。

  3. ボタンを押して、アクティビティ B を開始します。

// すべてが大丈夫です

  1. アクティビティ B を閉じます ([戻る] ボタンを押すか、onBackPressed を呼び出すか、終了します)。

  2. アプリを最小化します。

  3. 5 ~ 6 分以上経過したら、アクティビティ A に戻ります。

  4. アクティビティ B を開始します。

// 現時点では、常にこのエラーが発生します。

アプリケーションを再起動するとすべて問題ありませんが、アクティビティ B を再度開くとエラーが表示されます。

この問題を解決する方法を誰が知っていますか?

Play Services Dynamic Security Provider を使用しています ( gRPC に必要です)。最新バージョンの Google Play Services (9.6.83) をインストールしました。問題は解決しません。

次のコードで ManagedChannel を作成します。

SpeechGrpc.SpeechStub を作成します。

build.gradle (モジュール: アプリ)

build.gradle (プロジェクト)

お時間をいただきありがとうございます:)

0 投票する
2 に答える
1021 参照

google-speech-api - Google Speech API asyncrecognize リクエストの結果を取得する方法

私は以下を実行しました

戻った

ここで利用可能な対話型 GET を使用してみました` 上記の名前の値を渡します (約 12 時間後)、

ここに画像の説明を入力

しかし戻ってきた

何か不足していますか?たとえば、これを適切に実行する方法、または私の音声認識応答は? どこかの雲の中にありますか?

0 投票する
1 に答える
861 参照

curl - Invalid json payload for syncrecognize curl request

I followed https://cloud.google.com/speech/docs/getting-started and successfully ran

to get the expected output. However, now I am trying to do essentially the same thing but for a local flac file so I'm instead running:

and I'm getting a response of

The google api developer console shows the message coming in but give me no further information to help me. I've also tried

and am also getting a 400 Bad Request error.

私が目指していることを成功させた人はいますか?私が見つけることができるすべての例は、最小限のcurlまたはwgetリクエストとは対照的に、アップロードされたファイルのAPIを使用するか、いくつかのライブラリを使用するためのものです.

0 投票する
4 に答える
1371 参照

android - API キーを使用して Android で GRPC を介して Google Cloud Speech を認証する

GRPC 経由でストリーミング モードのサービス アカウントを使用して、Android アプリで Google Cloud Speech を動作させることができました。ただし、私が読んだことによると、セキュリティ上の理由から、これらの資格情報 (現在はリソースに JSON ファイルとして保存されている) を含む Android アプリをデプロイするべきではありません。正しいことは、https ://cloud.google.com/speech/docs/common/auth で説明されているように、API キーを作成することです。

これにより、特定の Android アプリへのアクセスを制限できます。しかし、GRPC から API キーを使用する方法を見つけることができませんでした。GoogleCredentials現在、JSON ファイルからインスタンスを作成していますが、これは正常に機能します。API キーから資格情報オブジェクトを取得するにはどうすればよいですか?