問題タブ [google-speech-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
853 参照

c# - C# コードでの Google Speech API

C# で音声認識用のアプリケーションを開発しています。そのために Google Speech API を使用したいと考えています。例: このシナリオのアプリケーションを開発しています: 私: 私のコンピューターの助けが必要ですか? 適用: あなたが私に必要とした助けの種類。

Google クラウド プラットフォーム -> API ID マネージャー -> 資格情報からキーを生成します。私はここからコードを取得しますc#でGoogle音声認識APIを使用するには?

この問題を解決する方法を教えてください。

0 投票する
1 に答える
838 参照

node.js - Google 音声認識 API v2 中間結果

ノード js npm google-speech-api https://www.npmjs.com/package/google-speech-apiを使用して Google 音声認識 API v2 に取り組んでいますが、「中間結果」を取得する必要があります。 .

処理中のオーディオの中間結果を取得するにはどうすればよいですか。オンラインで検索しましたが、役立つ情報を見つけて機能させることができませんでした。

以下は私が現在取り組んでいるコードです:

0 投票する
2 に答える
1021 参照

google-speech-api - Google Speech API asyncrecognize リクエストの結果を取得する方法

私は以下を実行しました

戻った

ここで利用可能な対話型 GET を使用してみました` 上記の名前の値を渡します (約 12 時間後)、

ここに画像の説明を入力

しかし戻ってきた

何か不足していますか?たとえば、これを適切に実行する方法、または私の音声認識応答は? どこかの雲の中にありますか?

0 投票する
2 に答える
11550 参照

audio - Google Cloud Speech API が認識する音声ファイルの種類は何ですか?

Google の Cloud Speech API を使用しようとしています。ここにドキュメントとコード例があります:

サンプル コードが含まれているファイル audio.raw を指定すると、サンプル コードを問題なく実行できますが、簡単な .wav ファイルを指定することはできません。

オーディオ サンプル ファイルの形式がわかりません。

おそらく 10 秒のオーディオを含む .wav ファイルでは、空の結果が得られます。

私はこの答えを知っています。

空の結果を返すGoogle Cloud Speech API

私の質問は以前に尋ねられましたが、質問に対する回答がありませんでした。

Cloud Speech API でサポートされている音声の種類は何ですか?

これを機能させるために、オーディオ ファイルのプロパティを適切に取得する必要があるとは想像できません。私の一般的なユースケースは、誰かが会議を記録し、記録のパラメータがわからず、テキストファイルだけが欲しいというものだと思います。

0 投票する
0 に答える
1323 参照

php - Google Chrome から音声を録音して Cloud Speech API に送信

API キーを使用して、RAW オーディオ ファイルを Google の Cloud Speech API に正常に送信しました。ここで、Chrome のブラウザを使用して自分の声を録音し、「audio.raw」の代わりに送信したいと思います (Google.com のように)。HTML5スクリプトであるべきだと思います。

これまでに行ったことは次のとおりです。

0 投票する
2 に答える
2400 参照

python - Google Speech Recognition API が音声の最初の 2 ~ 3 秒の変換済みテキストのみを返す理由

Google Cloud Console でプロジェクトを作成し、このプロジェクトで Google Speech API を有効にして、資格情報を作成しました。また、Google が推奨する transcribe.py を使用し、

https://cloud.google.com/speech/docs/samples

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech

https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/api-client/transcribe.py

Google によって生成された API キーを使用して、音声ファイル (30 秒) をテキストに正常に変換できますが、最初の 2 ~ 3 秒だけを完全に変換することはできません。私のアカウントは現在無料トライアル中なので、アカウントの種類(無料トライアル)のせいなのか疑問です。

Google からの応答は次のようになります}]}]}

音声ファイルは wav ファイル形式 (ffprobe で出力) ストリーム #0:0: 音声: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, 1 チャンネル, s16, 256 kb/ s

オーディオ ファイルが Google ドライブにアップロードされました。リンクはこちら https://drive.google.com/file/d/0B3koIsnLksOLQXhvQ1ljS0dDXzg/view?usp=sharing

上記のプロセス/手順の何が問題なのか知っている人はいますか? または、これは Google 音声認識 API のバグですか?

0 投票する
2 に答える
2664 参照

google-speech-api - StreamingRecognize を 1 分以上使用するには?

Google Speech API を使用するのは初めてです。私のアプリケーションでは、音声認識のためにオーディオ要求を継続的にストリーミングする必要があります。連続1分以上の使用になります。ただし、使用制限に従って、サービスは 60 秒後に停止します。この問題を回避する方法はありますか?

どんな助けでも大歓迎です。

ありがとう

0 投票する
1 に答える
2243 参照

c# - Google クラウド ストリーミング音声 API

Google Cloud Speech API によるリアルタイムの音声認識が必要です。ただし、まだベータ版であり、インターネット上で利用できる有用なものはあまりありません.

https://cloud.google.com/speech/docs/samplesここで利用できるサンプルはほとんどありませんが、C# を使用したスト​​リーミング API が表示されません。それは、音声入力を Google Cloud Speech API にストリーミングするために C# を使用できないということですか?

.NET を使用して音声入力を Cloud Speech API にストリーミングしようとした人はいますか?

参考までに、Google が提供する通常の Web Speech API は使用できません。Goolge Cloud Speech API のみを使用する必要があります。