1

Pocketsphinx の音声機能を Android アプリケーションに統合する必要があるプロジェクトに取り組んでいます。実際、フランス語の音素を認識できる Pocketpshinx が提供する音素認識機能を統合する必要があります。たとえば、音声認識エンジンは音節 (「de」、「re」、「se」など) を認識できる必要があります。 )、子音(「m」、「f」、「g」など)、二重子音(「kl」、「ks」、「gr」など)、母音(「a」、「o」など) 、「e」など)。現在、上記の音素を認識するために Pocketsphinx を統合しましたが、非常に悪い結果が得られました。たとえば、「o」を発音すると、「SIL ff ei au」と認識されることがあります。(私は文字「f」と「e」をまったく発音していませんでした)、または発音されていない何かが最初に表示されます。最初に出てくる文字はいつも同じとは限りません(「ll」や「uu」などになることもあります)。しかし、私が発音する文字が最初に現れることがあります (たとえば、"a" の場合、"SIL aa SIL" となります) が、これはめったに起こりません。では、何が問題なのか、この問題を解決するための提案を教えてください。これらの気になる文字だけで言語モデルと辞書を作成する必要がありますか(文字数が決まっているため)?それとも、音響モデルを適応させるか、音響モデルをトレーニングする必要があるのでしょうか? または、発音されていない他の何かが最初に表示されます。最初に出てくる文字はいつも同じとは限りません(「ll」や「uu」などになることもあります)。しかし、私が発音する文字が最初に現れることがあります (たとえば、"a" の場合、"SIL aa SIL" となります) が、これはめったに起こりません。では、何が問題なのか、この問題を解決するための提案を教えてください。これらの気になる文字だけで言語モデルと辞書を作成する必要がありますか(文字数が決まっているため)?それとも、音響モデルを適応させるか、音響モデルをトレーニングする必要があるのでしょうか? または、発音されていない他の何かが最初に表示されます。最初に出てくる文字はいつも同じとは限りません(「ll」や「uu」などになることもあります)。しかし、私が発音する文字が最初に現れることがあります (たとえば、"a" の場合、"SIL aa SIL" となります) が、これはめったに起こりません。では、何が問題なのか、この問題を解決するための提案を教えてください。これらの気になる文字だけで言語モデルと辞書を作成する必要がありますか(文字数が決まっているため)?それとも、音響モデルを適応させるか、音響モデルをトレーニングする必要があるのでしょうか? 何が問題なのか、この問題を解決するための提案を教えてください。これらの気になる文字だけで言語モデルと辞書を作成する必要がありますか(文字数が決まっているため)?それとも、音響モデルを適応させるか、音響モデルをトレーニングする必要があるのでしょうか? 何が問題なのか、この問題を解決するための提案を教えてください。これらの気になる文字だけで言語モデルと辞書を作成する必要がありますか(文字数が決まっているため)?それとも、音響モデルを適応させるか、音響モデルをトレーニングする必要があるのでしょうか?

事前にどうもありがとうございました!

4

1 に答える 1

1

モデルで feat.params を見つけ、選択に応じて-cmuinitの値を変更します。また、 誤報を除去するために、 「-kws_threshold」の値を1e-40fに変更します。

于 2016-07-27T08:21:14.977 に答える