私の声を認識してテキストに変換し、トーストで話した内容を表示する Android アプリケーションを構築したいと考えています。音声認識を起動するボタンを使用してこれを行うことができます。でも今は自分の声だけをベースに動かしたい。
アプリケーションは音声認識をトリガーし、私が話し始めたときにのみ私の声を聞き始め、無音を感知すると聞くのを停止する必要があります。トーキングトムアプリケーションの機能と同じです。そこに音声が録音されますが、音声認識を使用して認識したいです。このようなもの:
if(no silense)
Launch Recognizer
else if(silence)
Stop Recognizer
Show toast
主な問題は、音声認識エンジンを起動する前に、ユーザーが何かを話しているかどうかをどのように感知できるかということです。ノイズの強さを感知する方法はありますか..??
第二に、バックグラウンドで音声認識を起動する方法はありますか??
バックグラウンド サービスで音声信号 (誰かが話し始める) を検出できれば、音声認識エンジンがすぐに起動して音声を認識できますか?