7

私は iOS の音声認識を使用していますが、十分なコンテキストがある場合はいつでも非常にうまく機能します。数値入力のみに音声認識を使用していますが、問題が発生しています。たとえば、1 桁の数字 (2 - to、too、または 8 - ate など)。十分なコンテキストがありません。または、2 桁の数字を使用することもできます (80 は馬鹿と訳されることがあります)。入力が数値になることを音声認識エンジンに示したいと思います。たとえば、入力が "number 2" の場合、音声認識エンジンは素晴らしい仕事をします。

SFSpeechRecognitionTaskHint (unspecified、dictation、search、confirmation) などのヒントを試してみましたが、これらのモードはいずれも数値入力に適していません。

したがって、質問は次のとおりです。

  • オーディオが数値になることを SFSpeechRecognizer にヒントを与える方法はありますか? また
  • 私のニーズにより適した別の音声認識技術はありますか?

また、これが多くの異なる言語 (英語だけでなく) でも機能することを望んでいることにも注意してください。

助けてくれてありがとう、エリック

4

1 に答える 1