音声を使用してユーザーと対話する Android アプリケーションを開発したいと考えています。http://developer.android.com/reference/android/speech/RecognizerIntent.htmlで Google の Speech to Text API を見ました。
分類サービスを提供するものは見つかりませんでした。認識は、分類よりもはるかに困難です。私のユースケースでは、私のアプリはユーザーにオプションを提供します(例:左または右と言います)。したがって、ユーザーが言ったことを認識するという難しい問題を解決する代わりに、ユーザーが左または右のどちらを言ったかを判断するだけで済みます。音声分類の現在の最先端技術は、後者のバイナリ分類問題をほぼ 99% の精度で解決できると信じています。
本格的な認識ではなく、音声をいくつかの (2-3) クラス (単語/フレーズ) に分類するために最適化された API ですか?
(Java/C++/機械学習の経験はかなりありますが、Android の経験はありません)
(上記の認識は、無限に多くの文への分類と見なすこともできます。したがって、それはより難しい問題です(2対可算無限クラス))