1

中国語の音声認識アプリを作りたいです。チュートリアルを元に言語モデル(CMUCLMTKを使用)と音響モデルを構築します

http://cmusphinx.sourceforge.net/wiki/tutoriallm

http://cmusphinx.sourceforge.net/wiki/tutorialam

しかし、使用中に何も出力されませんでした

pocketsphinx_continuous -hmm ... -lm ... -dict ...

のような出力

READY....
Listening...
Recoding is stopped, start...
Stoped listening...
...(lots of INFO)
000000000:(nothing here!)
READY....

wav ファイルのフォーマットを確認しましたが、16it 16KHz mono です。また、./scripts_pl/decode/slave.plコマンドを使用すると、結果は 40% のエラー率になります (私のモデルとトレーニング セットは非常に小さいです)。PocketSphinx を英語モデルでテストしたところ、非常にうまく機能したため、私のデバイスはうまく動作しています。

他に何がその奇妙な結果につながる可能性がありますか?

4

1 に答える 1

0

他に何がその奇妙な結果につながる可能性がありますか?

使用しているデータ ファイルを提供していないため、質問に答えることができません。チュートリアルのトラブルシューティング セクションには、

トレーニングについて助けを求めたい場合は、トレーニング フォルダーまたは少なくとも logdir フォルダーを提供してみてください。喜んでお手伝いさせていただきます。

于 2012-05-15T05:03:57.220 に答える