中国語の音声認識アプリを作りたいです。チュートリアルを元に言語モデル(CMUCLMTKを使用)と音響モデルを構築します
http://cmusphinx.sourceforge.net/wiki/tutoriallm
http://cmusphinx.sourceforge.net/wiki/tutorialam
しかし、使用中に何も出力されませんでした
pocketsphinx_continuous -hmm ... -lm ... -dict ...
のような出力
READY....
Listening...
Recoding is stopped, start...
Stoped listening...
...(lots of INFO)
000000000:(nothing here!)
READY....
wav ファイルのフォーマットを確認しましたが、16it 16KHz mono です。また、./scripts_pl/decode/slave.pl
コマンドを使用すると、結果は 40% のエラー率になります (私のモデルとトレーニング セットは非常に小さいです)。PocketSphinx を英語モデルでテストしたところ、非常にうまく機能したため、私のデバイスはうまく動作しています。
他に何がその奇妙な結果につながる可能性がありますか?