問題タブ [sfspeechrecognizer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
37 参照

speech-to-text - カスタム ドメインの SFSpeechRecognizer?

私は TLSphinx (Pocketsphinx の Swift ラッパー) をいじっていましたが、しばらくしてあきらめました。私の限られた文法のユースケースには理想的でした。代わりに、オフグリッド バージョンの SFSpeechRecognizer を使用したいと考えていますが、ドメイン固有の用語と巨大な大規模言語モデルのあいまいさを認識することに懸念を抱いています。文法を制限するような方法で SFSpeechRecognizer をカスタマイズする方法はありますか?

0 投票する
0 に答える
177 参照

ios - マイクに AVSpeechSynthesizer からのオーディオを無視させる

この質問に触発されました(回答がありませんでした)。

コンテキスト: 2 つのボタンとテキスト フィールドを持つ (swiftUI) ビューがあります。1 つのボタンでマイクがオンになり、SFSpeechrecognizer を使用して音声がテキストに変換されます (そしてテキスト フィールドに入力されます)。これはサーバーに送信され、アプリは AVSpeechSynthesizer を介して読み上げられる応答を受け取ります。アプリは会話型であるため、マイクは常にオンになっています。このため、話された出力はマイクによってキャプチャされています。

問題: マイクを介してアプリを制御しているため、応答が話されているときにマイクを無効にしたくありません。AVSpeechSynthesizer によって話された音声をマイク (SFSpeechrecognizer) に無視させることは可能ですか? Facetime は、デバイスで再生される音楽を無視することで、同様のことを行います。

私の音声からテキストへのコードは、ほとんどがthisから変更されています。

以下のテキスト読み上げスニペット: