問題タブ [sfspeechrecognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1380 参照

ios - 数値入力のiosでの音声認識を改善するには?

私は iOS の音声認識を使用していますが、十分なコンテキストがある場合はいつでも非常にうまく機能します。数値入力のみに音声認識を使用していますが、問題が発生しています。たとえば、1 桁の数字 (2 - to、too、または 8 - ate など)。十分なコンテキストがありません。または、2 桁の数字を使用することもできます (80 は馬鹿と訳されることがあります)。入力が数値になることを音声認識エンジンに示したいと思います。たとえば、入力が "number 2" の場合、音声認識エンジンは素晴らしい仕事をします。

SFSpeechRecognitionTaskHint (unspecified、dictation、search、confirmation) などのヒントを試してみましたが、これらのモードはいずれも数値入力に適していません。

したがって、質問は次のとおりです。

  • オーディオが数値になることを SFSpeechRecognizer にヒントを与える方法はありますか? また
  • 私のニーズにより適した別の音声認識技術はありますか?

また、これが多くの異なる言語 (英語だけでなく) でも機能することを望んでいることにも注意してください。

助けてくれてありがとう、エリック

0 投票する
1 に答える
4713 参照

ios - エラー ドメイン=kAFAssistantErrorドメイン コード=209 "(null)"

の問題に直面していSFSpeechRecognizerます。アプリケーションを起動して数秒後、エラーが発生し始めます

Error Domain=kAFAssistantErrorDomain Code=209 "(null)"" and "Error Domain=kAFAssistantErrorDomain Code=203 "Timeout" UserInfo={NSLocalizedDescription=Timeout, NSUnderlyingError=0x170049990 {Error Domain=SiriSpeechErrorDomain Code=100 "(null)"}}

アプリケーションは認識を停止します。

endAudio()Appleは1分以上認識できないため、20秒ごとに再起動しようとしています。

これに関するヘルプは本当にありがたいです。

0 投票する
0 に答える
1725 参照

android - SpeechRecognizer と MediaRecorder による録音と音声認識の同時実行

音声の録音と音声認識を同時に行おうとしています。それらはそれぞれ個別に機能しますが、一緒に機能するのは録音のみです。

コードは次のようになります。

両方のメソッドが呼び出されると、onReadyForSpeech コールバックが呼び出されますが、何も起こりません。startRecognition() のみが呼び出された場合、音声認識は正常に機能します。

音声認識がマイクからのバッファも使用しているためだと思いますが、この問題をどのように回避できるのでしょうか?

編集:クラウドAPIやその他の非オフラインAPIを使用するつもりはありません(他の同様の質問で提案されているように)。また、FLAC アプローチを採用すると、部分的な書き起こし結果を取得できなくなる可能性があります。私はまだ使用を検討していますが、可能であれば、より標準的な非 jni の代替手段を好むでしょう。

0 投票する
1 に答える
53 参照

c# - C#で音声認識信号のサンプルにアクセスしますか?

speechRecognitionEngine によって処理される信号のサンプルにアクセスするにはどうすればよいですか? [C#]

基本的に、私のプログラムは音声をよく認識しますが、認識された信号の特定のサンプルにアクセスするにはどうすればよいですか? 私は私が行くことができることを知っています:

しかし、それは私が望むデータを私に与えません。私はintのベクトルか何かが欲しいです。助けてください