アプリにOpenEarsを使用しました。アルファベットの「a」から「z」を認識してください。しかし、それは単語よりもアルファベットを認識するという点で悪い認識を持っていました。
では、どうすればサウンドモデルを使用してOpenEarsの認識を向上させることができますか。
また、OpenEarsを使用して特別な音を認識するにはどうすればよいですか。
例えば。OpenEarsに犬の音を出して、「犬」を返してもらいたい
したがって、これは2つの部分からなる質問であり、コミュニティの分割に適している可能性があります。私が理解しているOpenEarsは、辞書の単語を使用するのに最適です。アルファベットを認識させたい場合は、文字だけを使用するのではなく、各文字の音素的スペルを使用してみます。したがって、「f」を使用する代わりに「ef」を使用します。
質問の2番目の部分については、「ラフ」になる特定の種類の犬を認識できるかもしれませんが、より小さな犬はより多くの「イップ!」最初の辞書にも追加する必要があります。
私はデモアプリを入手して、実際にこれらの単語を試してみました。