問題タブ [google-speech-api]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Android で SpeechRecognizer をループする
アプリの音声認識をループします。このコードを使用して、音声の認識を開始しました。
http://www.truiton.com/2014/06/android-speech-recognition-without-dialog-custom-activity/
テキストを認識した後、突然認識を再開し、それをテキストボックスに出力して、他のテキストを認識します。私はすでにこれを試しました:
endOfSpeech メソッドで実行しましたが、結果はなく、音声認識にバグがありました。より良い解決策はありますか?前もって感謝します。
speech-recognition - Google Speech Recognition API でのカスタム XML 文法の使用
「コマンドモード」でMicrosoft SAPIが使用するようなxmlまたはコンパイル済みの文法を使用して、Google音声認識APIによって認識される単語やフレーズを制限できるかどうかは誰にもわかりませんか? それとも、この時点ではまだ彼らの条件を口述し、後で整理しようとしているだけですか? 本当に知りたいのですが... 貴重な小さなドキュメントを見つけました。
どうもありがとう、ファーリー
android - Android の Google 音声認識をカスタマイズすることはできますか?
Android での Google 音声認識に関していくつか質問があります。Google Speech Recognition オンライン サービスを使用して Android アプリケーションを開発しました。さて、それをさらに改善するために、以下の質問に対する答えを知る必要があります.
オフライン認識またはオンライン認識で「ユーザー辞書」を追加できますか?
文法ベースの認識、キーワード認識、およびキーフレーズ認識を実行するように命令できますか? 現在、一般的な認識ではなく、そのようなオプションはないようです。
「リッスンタイムアウト」を変更できますか? どれだけ変わったように思えますが、うまくいきません。
java - Android音声認識:最高の信頼スコアで結果を得るには?
音声認識を使用して Android アプリケーションを開発しようとしています。以下のコードを見てください。
ここでの問題は、 「最高の信頼スコア」で結果を取得することです。どうやってやるの?
audio - Google Speech Recognition API: 各単語のタイムスタンプ?
リクエストを行うことで、Google の音声認識 API を使用して音声ファイル (WAV、MP3 など) の書き起こしを取得できます。http://www.google.com/speech-api/v2/recognize?...
例: WAV ファイルで「 1 2 3 フォー ファイブ」と言いました。Google API は私にこれを与えます:
質問: 各単語が発声された時間 (秒単位) を取得することは可能ですか?
私の例では:
つまり、「1」という単語は 00:00:00.23 から 00:00:00.80 の間に発声され、
「2」という単語は 00:00:01.03 から 00:00:01.45 (秒単位) の間に発声されました。
PS: 英語以外の言語、特にフランス語をサポートする API を探しています。
php - Google Text-To-Speech API を使用して音声を保存する
この質問で説明されているメソッドを実装して、特定の文字列のオーディオ ファイルをダウンロードする php 関数を作成しようとしていますが、Google の悪用保護を回避できないようです。結果は散発的で、音声ファイルを取得することもあれば、「コンピューター ネットワークからの異常なトラフィックが検出されました」という応答により、空の 2KB mp3 になることもあります。これまでに得たものは次のとおりです( $file にはコード内の場所がありますが、この目的のために省略しました):
android - タップして話すインターフェイスを非表示にする google speech api
音声コマンドを使用してメイン メニューにアクセスするゲームを開発しようとしています。Google スピーチからタップして話すインターフェイスを非表示にする方法を知りたいですか? それは私の画面全体をほぼカバーするからです。
android - (Android Studio Speech Recognizer) RECORD_AUDIO と INTERNET を指定したにもかかわらず、エラー 9 (権限が不足しています) が表示されます
私の Android マニフェスト ファイルは次のようになります。
私のログは、onError() 関数で生成されたエラー 9 が原因で停止したことを示しています。
このサンプル プログラムを実行して、音声認識ソフトウェアに慣れようとしています。
これは、実際のデバイスではなく android studio で実行しているという事実によって引き起こされる問題でしょうか? 私はこれにかなりこだわっています。