私は、人々が話し、いくつかのオプション (文字列) から選択できるようにするアプリを作成しています。Android Speech Recognizer を自分の考えに合わせるのに少し問題があります。
「有効な」パラメータを SpeechRecognizer に渡し、「最適な」一致を選択させる方法はありますか?
コードは必要ありません。今日、私のgoogle-fuが失敗しているように見えるので、ガイダンスが必要です。
私は、人々が話し、いくつかのオプション (文字列) から選択できるようにするアプリを作成しています。Android Speech Recognizer を自分の考えに合わせるのに少し問題があります。
「有効な」パラメータを SpeechRecognizer に渡し、「最適な」一致を選択させる方法はありますか?
コードは必要ありません。今日、私のgoogle-fuが失敗しているように見えるので、ガイダンスが必要です。
この問題に対する私たちの解決策は、http://kaljurand.github.io/Grammars/で説明されています。たとえば、このページからリンクされている論文をチェックしてください。
Kaarel Kaljurand、Tanel Alumae。音声認識ベースのユーザー インターフェイスにおける制御された自然言語 (CNL 2012)
基本的な考え方は次のとおりです。
あなたの場合、これはすべてやり過ぎかもしれません。Google の結果の後処理 (@gregm が示唆するように) は、実装が確かに簡単です。しかし、より複雑な言語モデルや多言語モデルに拡張したい場合、私たちのアプローチは必要なモジュール性と表現力を確実に提供します。
いいえ、そのようなパラメータはありません。Google の音声認識は十分に柔軟ではありません。CMUSphinxのような外部音声認識ツールキットを使用できます
いいえ、認識を制限したり、最適な一致を作成するのに役立つパラメーターを渡すことはできません。それを自分で実装する必要があります。
あなたがしたいことは、いくつかのアルゴリズムを使用して、Android の音声認識エンジンが返すものと目的のオプションを一致させることです。これは、Cumin のように、Android の認識エンジンが認識できない単語をアプリが認識しなければならない場合に特に重要です。
このために、ここにあるような音声一致アルゴリズムを使用できます
Android でのいくつかの実装とサンプル コードについては、このオープン ソース プロジェクトをチェックしてください: GAST .