android - Android用音声分類API

翻译自：https://stackoverflow.com/questions/16805818 2013-05-29T04:59:07.377

136 次

音声を使用してユーザーと対話する Android アプリケーションを開発したいと考えています。http://developer.android.com/reference/android/speech/RecognizerIntent.htmlで Google の Speech to Text API を見ました。

分類サービスを提供するものは見つかりませんでした。認識は、分類よりもはるかに困難です。私のユースケースでは、私のアプリはユーザーにオプションを提供します（例：左または右と言います）。したがって、ユーザーが言ったことを認識するという難しい問題を解決する代わりに、ユーザーが左または右のどちらを言ったかを判断するだけで済みます。音声分類の現在の最先端技術は、後者のバイナリ分類問題をほぼ 99% の精度で解決できると信じています。

本格的な認識ではなく、音声をいくつかの (2-3) クラス (単語/フレーズ) に分類するために最適化された API ですか?

(Java/C++/機械学習の経験はかなりありますが、Android の経験はありません)

（上記の認識は、無限に多くの文への分類と見なすこともできます。したがって、それはより難しい問題です（2対可算無限クラス））

android - Android用音声分類API

1 に答える 1

Related

Reference