1

ユーザーがおそらく発する単語をより簡単に認識できるように、音声認識エンジンを適切にパラメーター化するにはどうすればよいですか?

私が知る限り、方法はありません。

このサイトは間違っていると思います: http://www.4feets.com/2009/04/speech-recognition-in-android-sdk-15/

サイトによると、このコード: ArrayList< String > potentialResults = new ArrayList< String >();
potentialResults.add("黄色");
potentialResults.add("緑");
potentialResults.add("青");
potentialResults.add("赤");

// Create Intent  
Intent intent = new Intent("android.speech.action.RECOGNIZE_SPEECH");  

あなたがそれらの言葉を言うかもしれないというヒントを認識エンジンに与えます。ただし、まったく何もしないようです。また、次のようなGoogleのドキュメントとも矛盾しています。

「ACTION_RECOGNIZE_SPEECH を実行したときの潜在的な結果の ArrayList。RESULT_OK が返された場合にのみ存在します。」これは、配列が入力ではなく戻り値であることを示唆しています。

これをテストするには、以下を追加してみてください: ArrayList< String > potentialResults = new ArrayList< String >();
potentialResults.add("クミン"); 音声認識エンジンにそれを認識させようとします。あなたはそれが非常に難しいと思うでしょう。

音声認識エンジンを適切に制御する方法について洞察を持っている人はいますか?

4

2 に答える 2

5

「制御」が「可能な結果のリストを提供する」ことを意味する場合、そうではないと思います。

リンク先のブログ投稿が間違っていることに対して、あなたは正しいと思います。ただし、私の知る限り、スピーチを制御できるのは、それがLANGUAGE_MODEL_FREE_FORMか かを示すことだけですLANGUAGE_MODEL_WEB_SEARCH

EXTRA_RESULTSあなたが示すように、話された散文に一致する可能性のある出力です。API サンプルで使用されている結果を確認できます。

于 2009-08-02T16:19:39.677 に答える
1

これに対処するために私が思いついたのは、可能性のデータベースを作成することでした. 次に、結果を取得して 2 文字または 3 文字にサブストリング化し、用語についてデータベースにクエリを実行します。誰かが赤と言った場合、データベースで LIKE 're%' を検索しますが、これは実際に必要なものに対してかなり正確です。

于 2010-06-26T20:49:36.363 に答える