私はsphinx4と音声認識のことは初めてです。sphinx4を使って音声アプリを作っています。問題はノイズであり、ユーザーによる音声入力がなくてもプログラムによって認識されます。つまり、ユーザーによる音声入力がない場合でも音声をテキストに変換するため、精度に影響します。
主な問題は、ノイズリダクションをどのように実装するかです。これは、マイクに向かって何も話していなくても、システムが入力を検出するためです。だから、ノイズのせいだと思います。
ノイズリダクションについてオンラインで確認しましたが、同じことについて明確な情報はほとんどありません. sphinx4 に付属している Denoise.java という名前のファイルについて、インターネット上でいくつかの情報があります。しかし、sphinx4-1.06 にはありません。
もう 1 つのファイルは WienerFilter.java です。wienerfilter は、ノイズの多い信号に使用されるフィルターのタイプです。しかし、そのファイルを使用または実装するための指示はありません。
プログラムの文法ファイルである hello.gram には、すでにいくつかの単語を追加しています。Imtool によって生成されたこれらの余分な単語の音声表現が辞書に追加されました。
私はEclipseとsphinx4-1.0beta6を使用しています
"HOW TO ACITIVATE NOISE CANCELLATION IN SPHINX4" のスタック オーバーフローに関する質問が 1 つありますが、まだ回答がありません。