非常に具体的な要件があります。私は、ユーザーが HN56C12345 (任意の英数字シーケンス) の形式の従業員番号をアプリに話せるようにするアプリケーションに取り組んでいます。http://cmusphinx.sourceforge.net/wiki/tutoriallmのリンクを確認しましたが、それが私のユースケースで機能するかどうかはわかりません。
だから私の質問は3つです:
- 私の場合、Sphinx4 は実際に emp 番号のような高精度の英数字シーケンスを認識できますか?
- はいの場合、だれかがSphinx4でカスタム言語サポートをゼロから構築した具体的な例/リファレンスページを教えてください. これに関する詳細なステップバイステップのドキュメントはまだ見つかりません。英数字シーケンスに基づく辞書または言語モデルに取り組んだ人はいますか?
- このシナリオの音響モデルを構築するにはどうすればよいですか?