5

Android の Speech-To-Text エンジンを使用して、文中のさまざまな珍しい単語を認識できるようにしたいと考えています。

例を挙げると、「electroencephalograph」という言葉は、STT から「electronics supply graph」として出てきます。Soundex または Metaphone を使用して、話されている内容をハードコードされた値と比較すると、値がまったく一致しないか、ランダムに一致するように見えます。しきい値 (たとえば、Math.abs(str1.compareTo(str2)) <= 1) を使用すると、一致が非常に緩くなり、ほとんどすべてが一致します。

本質的に、私がやりたいことは、引用を暗唱して引用データベースから引用を検索することに似ています。問題は、Google の Speech-To-Text エンジンで使用される限られた単語セットにあるようです。

何か案は?

4

1 に答える 1

3

文法ベースの音声認識の有無にかかわらず、CMUSphinxを試すことができます。

Inimesedアプリを見てください。これは、CMUSphinx を使用して JSGF ベースの音声認識を行うオープンソースの Android アプリです。この場合、文法はユーザーのアドレス帳に基づいてコンパイルされます。この部分を単純に捨てて、すべてのフレーズを含む固定の文法を持つことができます。

問題が、時折変わった単語を含む自由形式の文である場合は、文法ベースの音声認識が機能しない可能性があります。この場合、n-gram 言語モデルで認識しますが、すべての珍しい単語を辞書に含めます。

于 2013-01-29T12:55:36.660 に答える