3

身体障害者を支援するカスタム Android アプリを作成しようとしています。音声認識に大きく依存する必要があります。アイデアは次のようになります。

  1. アプリは(音声認識を介して)彼のスピーチを受け入れます
  2. アプリは彼のスピーチを解析し、彼のコマンドを実行します (「パパにメール」、「フレッドにテキスト メッセージ」、「今何時?」などに加えて、彼のテレビや照明などを制御するために追加するその他の機能)
  3. 実行後、アプリは次のコマンドを待ちます (#1 にループバック)

#1 と #2 は正常に動作していますが、#3 の適切な方法がわかりません。次のコマンドまで数時間かかる可能性があるため、Google の音声認識ビューを無期限に実行したままにしておくことはできません。しかし、「トリガー」は音/声に基づいている必要があります。完全にハンズフリーでなければなりません。

理想的には、アプリが音を聞くだけで、その音が事前にプログラムされた特定のデシベル レベルを超えている場合、音声認識を開始します。ノイズを聞いているだけで常にループし、「とても」うるさい場合に反応することは可能ですか?

何か案は?

ありがとう

4

2 に答える 2

0

CMUSphinxは、これに対する優れたソリューションです。

  1. 簡単に連続聴取できる、音声検出APIを提供
  2. コマンドのカスタム セットの精度を上げることができます
  3. モデルをユーザーの声に適応させることができるため、精度が大幅に向上します

Android で CMUSphinx を使用する方法の詳細については、次を参照してください。

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/

于 2013-05-04T09:35:58.683 に答える
0

つまり、音声認識を継続的にしたいという考えです。それを行うのは非常に難しいです。しかし、私がこれを達成した方法は、次を使用することです。

   try {
       Thread.sleep(4500);
       mSpeechRecognizer.startListening(mSpeechRecognizerIntent);
   }  catch (InterruptedException e) {
        // It depends on your app logic what to do with InterruptedException
        // You can process it or rethrow or restore interrupted flag
   }

その後onReady(ユーザーが約4.5秒何も言わないと、リセットされて結果が表示されます。これは私にとってはうまくいきました。

于 2013-05-04T01:35:18.287 に答える