音声コマンドを認識できる Android アプリが必要なクライアントがいます。私が理解していることから、組み込みの音声からテキストへの機能は実際にデータを Google のサーバーに送信し、Google のサーバーからテキストの翻訳が返されます。音声データは非常に機密性が高いため、これは大きな問題です (データが Google との間で送受信されるときに暗号化されている場合を除きますが、暗号化されているとは思えません)。
私が考えることができる2つのオプションがあります。1 つ目は、Android で音声をテキストに変換することですが、これは非常にコストのかかる操作のように思えます。2 番目の可能性は、ローカル サーバーにデータを変換させることです (音声データが送受信されるときに、音声データと翻訳を暗号化できます)。これは CMU Sphinx がやってのけることができるものですか? アスタリスクサーバーにもアクセスできることは注目に値するかもしれませんが、これはおそらくこれを支援する可能性があります(わかりません)。
実際には、認識が必要な単語は 200 語までしかないはずです。私はオープンソース/フリー ソフトウェア ソリューションを好みますが、商用ソリューション (おそらく FlexT9) にもオープンです。理想的には、オーディオ ストリームをどこかに送信して、テキストである文字列を取得し、その文字列を解析して他のことを行うことができます。
私は過去にアンドロイドや音声認識の開発をあまり行っていないので、誰かが少なくとも私を正しい方向に向けることができることを願っています. ありがとう!