0

OpenEars を使用してゲームを作成しようとしています。動的言語モデル方式を使用しています。しかし、パフォーマンスは基準に達していません。認知度は非常に低いです。静的言語モデルを使用する利点はありますか?? 音声認識を改善する他の方法???

4

1 に答える 1

4

OpenEars 開発者はこちら。サブパーの認識につながる可能性のあることがいくつかあります。ここに本当に大きなものがあります:

  • 実際のデバイスではなくシミュレータを使用して認識をテストする
  • 言語モデルにスペルミスのある単語がある (これは、非常に多くの報告された問題の原因となる大きな問題です。単語のスペルミスがある場合、その正しい発音はどのようにして検出または導出され、音声辞書に登録されるのでしょうか? それはできません。であり、正しい発音は偽陰性になります)
  • 言語モデルに不要な句読点がある。.arpa ファイルの内容と .dic ファイルの内容を見て、それぞれのエントリが一致するかどうかを確認してください。
  • 音響モデルがトレーニングされている米国のアクセントとは非常に異なるネイティブ スピーカーのアクセントを持っているか、ネイティブ スピーカー以外のアクセントを持っている (これは公平ではありませんが、現実です)
  • すべての発音が推定されるため、言語モデルの大部分が英語以外の姓、英語以外のストリート名、または意図的にスペルミスされたバンド/スタートアップ名などの英語以外の単語で構成されている.

しかし、静的言語モデルと動的言語モデルは、精度レベルに関して大きな考慮事項ではありませんでした。これについてさらにトラブルシューティングを行う場合は、OpenEars サポート フォーラムにアクセスすることをお勧めします。スタック オーバーフローは、継続的なトラブルシューティング プロセスを行ったり来たりすることを意図したものではないため、喜んでお手伝いさせていただきます。おそらくそのうちの1つです。

于 2014-06-03T10:09:03.523 に答える