問題タブ [google-speech-to-text-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
376 参照

python - Google Speech to Text API の結果を処理する方法

Google Speech to Text API を使用しています。タイプ google.cloud.speech_v1.types.RecognizeResponse のオブジェクトを返します。複数のテキスト文字列を返すために繰り返し処理できないため、これは Python ではほとんど使用できないことがわかりました。

これを Python で使用できるようにするための解決策をよく探した後、Stack Overflow で google.protobuf.json_format.MessageToJson() から使用する解決策を見つけました。ただし、以下の関数を実行すると...

...次の出力が得られます。

ご覧のとおり、google MessageToJson 関数を実行した結果は実際には文字列であり、json.loads 関数を使用して Dict にロードする必要があります。

  • MessageToJson 関数が Dict / json オブジェクトではなく文字列を返すのはなぜですか?
  • Python で google.cloud.speech_v1.types.RecognizeResponse オブジェクトを操作して文字起こしされたテキストを取得する別の方法はありますか?

Google がこのオブジェクトを返す理由がわかりませんが、これは扱いが非常に困難です。

0 投票する
1 に答える
178 参照

speech-to-text - .opus オーディオ ファイルの場合、Google の音声からテキストへの構成はどのように見えますか

私は .opus オーディオ ファイルを Google の音声テキスト変換 API に渡しています。次の構成を使用しています。

  • encoding = enums.RecognitionConfig.AudioEncoding.OGG_OPUS
  • language_code = "en-US"
  • サンプルレートヘルツ = 16000

次のエラーが表示されます。

google.api_core.exceptions.GoogleAPICallError: None Unable to recognize speech, possible error in encoding or channel config. Please correct the config and retry the request.

FLAC や LINEAR16 などの他のエンコーディングを試してみましたが、出力として None が得られました。

opus オーディオ ファイルには追加の構成フィールドが必要で、構成ファイルはどのように表示されますか?

0 投票する
0 に答える
21 参照

twilio - Google Speech to Text API を使用してテキストが上書きされる

サーバー側のコードでは、クライアント側がサーバー側から転写テキストを受け取るときに、Web ソケット接続を使用してクライアント (Angular) に転写テキストを渡そうとしています。テキストを上書きするか、同じテキストが複数回書き込まれる場合があります私は.isFinalで試しましたが、問題は同じままです.Belowはそのコードスニペットです。

サーバー側のコード:

クライアント側のコード:-

参考URL:https ://www.twilio.com/blog/live-transcribing-phone-calls-using-twilio-media-streams-and-google-speech-text

注: サーバー側とクライアント側からの Nodejs & Express js:- Angular 8

どんな助けでも大歓迎です。

0 投票する
0 に答える
69 参照

python - Python: ユーザーが停止ボタンをクリックすると、Google オーディオ録音を停止します

Google Speech API を使用しています

システムは次のように機能します。

1- ユーザーが「開始」ボタンをクリックすると、システムは記録を開始します。

2- ユーザーが「停止」ボタンをクリックすると、システムは記録を停止し、結果を表示します。

彼女は私の「スタート」ボタンの定義です

私の質問は、ユーザーが記録を停止して「停止」ボタンをクリックしたいときに別の定義を呼び出すにはどうすればよいですか?