問題タブ [google-speech-to-text-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - OGG_OPUS 入力オーディオ ストリームを Google Speech-to-Text API で受け入れ可能なバイトストリーム形式に変換する方法は?
コンテキスト:元は OGG_OPUS 形式の録音済みオーディオ ストリームの URL があります。URL からの音声をバイト ストリームに変換しています (Google API で必要な場合 - https://cloud.google.com/speech-to-text/docs/reference/rest/v1p1beta1/RecognitionAudio )。
このバイト ストリームを Google Speech-to-text API に提供すると、null 応答が返されます。
質問:
- ここで Google API が Null 応答を返すのはなぜですか?
- Google API は音声入力の OGG_OPUS 形式を本当にサポートしていますか?
コードブロック
node.js - Google 公式ドキュメントの Google Cloud Speech to Text NodeJs が Google Compute Engine Linux サーバーで動作しない
NodejsでGoogle Cloud Speech APIを利用したストリーミング入力アプリの音声テキスト変換を開発したいと考えています。そのため、Google のサンプル ソースを使用し、SOX (バージョン 14.4.1) レコーダーを Windows PC にインストールし、ローカルで Nodejs アプリケーションを実行するとうまくいきました。しかし、Linux サーバーを使用して Google Compute Engine に Nodejs アプリケーションをアップロードすると、SOX のオーディオ デバイスが機能しません。エラーは【FAIL sox: missing filename】です。クライアント側からの音声はどのように受信されますか? Linuxで上記のエラーを解決する方法はありますか? app.js