問題タブ [voice-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - 音声検索ダイアログが入力を受け入れる準備ができているときの音声信号?
Google音声検索には、startActivityForResult()を介して呼び出した瞬間から、ダイアログボックスが表示されてスピーチの準備ができるまで、かなりの遅延があります。
これには、ユーザーが話す前に、ダイアログボックスが表示されるのを待って、常に画面を見る必要があります。
音声検索で音声入力を受け入れる準備ができたら、「音」やその他の非視覚的な合図を追加すると便利です。
これは可能ですか?
もしそうなら、どうやってそれをやるのですか?
c# - モノラルの音声認識
mono アプリケーションに音声認識機能を追加する方法はありますか。System.Speech (.net) と Microsoft.Speech (MS Speech Platform) の名前空間がありますが、Mono には見つかりません。では、Mono に音声認識機能を追加するにはどうすればよいのでしょうか?
iphone - iOSで2つの音声サンプルを比較するにはどうすればよいですか?
まず第一に、私の質問は音声認識の「古典的な」定義について言うことではないことを述べたいと思います。
私たちがやろうとしていることは、次の意味で多少異なります。
- ユーザーがコマンドを記録する
- 後で、ユーザーが事前に録音されたコマンドを話すと、特定のアクションが発生します。
たとえば、お母さんに電話をかけるための音声コマンドを録音しているので、お母さんをクリックして「お母さん」と言います。次に、プログラムを使用して「ママ」と言うと、自動的に彼女に電話がかかります。
音声コマンドと保存された音声サンプルの比較をどのように実行しますか?
編集:音声信号の比較だけで、「テキスト読み上げ」機能は必要ありません。明らかに、私たちはある種の既製の製品またはフレームワークを探しています。
android - Android: 音声認識を明示的に停止しますか?
を呼び出すことで、入力が完了したと見なす時間を増やすことができます。
ただし、Android音声認識アクティビティを開始した後、「キーワード」を受け取った後などに明示的に停止する方法はありますか.
iphone - iOS用の音響指紋コード?
私はiOS用の私のペットプロジェクトのために音響指紋(http://en.wikipedia.org/wiki/Acoustic_fingerprint)の主題を探し始めました、そして私はあるかどうか疑問に思いました:
- これを処理するiOS用のオープンソースライブラリまたはソースコードはありますか?
- 私がすべてのトレードコーダーのベテランジャックであると仮定すると、オープンソースバージョンがない場合、これを自分で実装することは非常に問題がありますか?
- iOSのAccelerateDSPライブラリはそのようなタスクを処理できますか?
ありがとう
android - SpeechRecognizer API を直接使用する - onResults() が null を返し続ける
この投稿の例に従ってみました。
これをサービスに実装しようとしているのではなく、標準的なアクティビティに実装しようとしているので、前述の投稿で説明されている問題は経験していません。
ただし、 getStringArrayList(RecognizerIntent.EXTRA_RESULTS)が null を返すと、その投稿で実装されているように、「音声結果がありません」というメッセージが表示され続けます。
明らかに、私は何をする必要があるかについて何かが欠けています
私は何が欠けていますか?
startListening() に加えて、startActivityForResult() も必要になる可能性はありますか? もしそうなら、私はすでにこれを試しましたが、完全な Google の音声検索アクティビティを呼び出しました (@vladimir.vivien がここに書いたように、これは私が避けようとしているものです)。これにより、2 つのレコグナイザーが同時に実行されるため、さらに多くの問題が発生します...
最初は、足りないのは Google のサーバーへの実際の送信だと思っていましたが、音声認識セッションの開始から終了までの LogCat 出力を調べると (以下を参照)、実際にhttp:/で TCP セッションが作成されていることがわかります。 /www.google.com/m/voice-search .
明らかな質問は、何が欠けているのかということです。
android - RecognitionListener.onReadyForSpeech() の DTMF トーンが音声と間違えられる
Google 音声検索では、startActivityForResult() を介して呼び出した瞬間から、ダイアログ ボックスが表示されて音声を受け取る準備ができるまで、大幅な遅延が発生します。
これにより、ユーザーは話す前に常に画面を見て、ダイアログ ボックスが表示されるのを待つ必要があります。
そこで、次のスニペットのように、RecognitionListener を実装し、onReadyForSpeech() で DTMF トーンを鳴らすことによって、ダイアログ ボックスの代わりに可聴信号を生成することを考えていました。
トーンは美しく聞こえますが...マイクにも「聞こえ」、音声認識サービスに到着し、常に認識エラーERROR_NO_MATCHが生成されます。
これを回避する方法はありますか?
android - Android SpeechRecognizer:stopListening()とcancel()
名前だけから、stopListening()はstartListening()の反対であることがわかります。
また、 destroy()はcreateSpeechRecognizer()の反対であることも理解できます。
しかし、cancel() ...は何の反対ですか?
それについてのドキュメントで私が見つけることができたのは次のとおりです。
音声認識をキャンセルします。
cancel()はstopListening()とどう違うのですか?
android - ERROR_RECOGNIZER_BUSY の処理方法
音声認識ベースのアプリで、ERROR_RECOGNIZER_BUSY を受け取ることがあります。直観的に、これには... retriesが必要ですよね?
問題は、このエラーが非常に文書化されていないことです。そのため、明らかに、この分野でより経験豊富な誰かが答えることができる質問があります。
- このようなエラーの原因は何ですか? 本当に忙しいサーバーだけですか(Googleで)?または、これは私のアプリのバグを示唆している可能性がありますか?
- 再試行する前に、明示的にセッションを閉じたり、再度開いたりする必要がありますか?
- どのくらいの頻度で再試行しますか? 1秒に1回?5秒ごと?他の?
あなたの経験豊富な洞察は大歓迎です。ありがとう。
android - RecognitionListener.onError() は自動的に SpeechRecognizer.cancel() を実行しますか?
さまざまな理由から、より簡単な(RECOGNIZE_SPEECH)アクティビティSpeechRecognizer
ではなく、生の APIを使用する必要があります。RecognizerIntent
それは、とりわけ、私がRecognitionListener.onError()
自分自身を処理する必要があることを意味します。
いくつかのエラーに対応して、私は単にリスニングを再開したいだけです. これは単純に見えますがSpeechRecognizer.startListening()
、エラーを呼び出すと、2 つの異なるエラーが発生することがあります。
と
もう一度電話をかける前に、クリーンアップを行う必要があったことを示唆していますSpeechRecognizer.startListening()
。
これが true の場合、RecognitionListener エラーが発生しても、リッスンが自動的に停止またはキャンセルされないことを意味します。
また、リスニングを停止/キャンセルするエラーもあれば、そうでないエラーもあります。SpeechRecognizer のエラーは、実際には 9 つしかありません。
- ERROR_NETWORK_TIMEOUT
- ERROR_NETWORK
- ERROR_AUDIO
- ERROR_SERVER
- ERROR_CLIENT
- ERROR_SPEECH_TIMEOUT
- ERROR_NO_MATCH
- ERROR_RECOGNIZER_BUSY
- ERROR_INSUFFICIENT_PERMISSIONS
どのエラーがリッスンをキャンセルし、どのエラーがキャンセルしないかについて、ドキュメンテーションにはあまり詳しく説明されていないため、経験に基づいて、再試行する前SpeechRecognizer.startListening()
にクリーンアップが必要なエラー (およびその程度) を知っていますか?