Android アプリケーションで PocketSphinx を使用して音声認識を実装しました。認識機能が敏感すぎることを除いて、すべて正常に動作します。アプリケーションの結果 (音声テキスト変換) が正しく機能しませんでした。
しきい値は、取得できる最低値である 1f まで変更済みです。
私は英語を使用し、特定の文法を持つ限られたライブラリを使用し、Sphinx Knowledge Base Tool を使用して独自の辞書を作成しました。
cmuSphinx のデモの音響モデル en-us-ptm を使用しましたが。
Sphinx が remove_noise 関数を持っていることをいくつか調査しましたが、それを見つけることができるようです。または、ポケットフィンクス認識機能を改善する他の方法はありますか?
ありがとうございました。