問題タブ [google-speech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
2191 参照

c# - C# を使用した Google 音声テキスト変換 API

音声ファイルのテキストへの音声変換に Google 音声認識を使用しています。出力として得られる応答は {"result":[]} のみを示します。出力結果が表示されません。c# で Google 音声認識 API を使用する方法からコードを選択しましたか? C#のGoogle Speech to Text API。上記のリンクのほぼすべての回答を試しましたが、それでもエラーが発生します。

私のコードは次のとおりです。

0 投票する
1 に答える
68 参照

nlp - Google Speech API のフレーズと一致

彼らが言う - スピーカーから音声をキャプチャします"I want to meet John Disilva"。これを Phrase as で Google Speech API に渡します{ 'John Disilva', 'Ashish Mundra'}。ただし、Google Speech API は完全なフレーズ、すなわち - を返します'I want to meet John Disilva'

名前部分のみを抽出することに関心があるため、フレーズを戻り値としてのみ取得できる方法はありますか?

その理由は、マイクに向かって誰かが話していることを制御できないからです。彼らは'I would like to see John Disilva'またはと言うことができます'Do you know John Disilva'が、私のユーザーは、抽出したいこの文のどこかに常にその名前を持っていると確信しています.

Google Speech API が、そのセンテンスで検出できた正確なフレーズを提供John Disilvaできる場合、そのフレーズを使用してコードをさらに処理できます。

0 投票する
0 に答える
340 参照

android - Google クラウド音声 API アクセス トークンのアップロード/ダウンロードの更新トークンはどこにありますか

Google Cloud Speech API のアクセス トークンは 1 時間ごとに期限切れになります。現在、サービス アカウントを使用して新しいアクセス トークンをリクエストしています。

$ gcloud auth print-access-token

アクセストークン

これはプログラムで行うことができますか?これにはリフレッシュトークンが必要ですか? 更新トークンを取得する方法とプログラムでアクセストークンを要求する方法は?

前もって感謝します

0 投票する
1 に答える
690 参照

python - Google Speech API 非同期リクエスト応答を取得するには?

非同期の google-speech-api リクエストを機能させようとしています。アドバイスに従って、play次のコマンドを使用します。

play audio2min.flac

ここに画像の説明を入力

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/api-clientのコードを使用します。次に、対応するエンコーディングでリクエストを適応させます。

次に、エラーが発生します。

次に、ファイルをGoogleストレージに置き、リクエストを適応させます"uri": "gs://path/to/my/audio2min.flac"

しかし、その後、エラーが発生します:

問題は次のとおりです。FLAC の代わりに LINEAR16 のエンコーディングを変更すると、無効な回答が得られます。

エンコーディングが本当に問題であることを確認するために、同期要求を含むファイルから 30 秒のサンプルを試しました。FLAC のエンコードでは機能しましたが、LINEAR16 のエンコードでは機能しませんでした。

ここからどうすればいいのか誰か説明してもらえますか?

0 投票する
1 に答える
1712 参照

speech-recognition - C# WinForm アプリの無料音声認識

Google Speech Recognitionとして機能し、まったく新しい単語を認識してテキストに変換できる、C#Windows Form Application実行可能ファイルの無料の音声認識を見つけようとしています。

System.Speech.Recognition を使用しようとしました。さまざまな方法がありますが、事前に記録されたコマンドには適しています。たとえば、Python を使用した Google 音声認識で動作するような結果は得られません。これは、少なくとも 95% 正しい結果であり、それは良いことです。しかし、どうやら私がキーを持っていない場合、無料で利用できず、実行可能ファイルで使用することはできません。

だから私はMicrosoft Cognitive ServicesのBing Speech APIを試してみたいのですが、それをコーディングする方法の例、いくつかの基本的な例を見つけることができません。誰かがこのツールを扱っている場合は、私が理解するのを手伝ってもらえますか

0 投票する
1 に答える
1668 参照

google-speech-api - Google 音声 API エラー

Linux マシンで簡単なコマンドを実行すると、次のようになります。

エラーが発生しています:

Your client does not have permission to get URL /speech-api/v2/recognize?output=json&lang=he-IL&key=THE_KEY from this server. Invalid key. That’s all we know.

私が生成したキーには制限がありません (また、音声 API に対して有効になっています)。
サーバーのIPアドレスも追加しましたが、同じエラーが発生しました。

私がこれまでに見つけた結果は、クロムクライアントに関連しています...私はシェルにいます。

ありがとう