ユーザーをリッスンするソフトウェア用にアラビア語用の独自の CMUSphinx 言語モデルを作成し、手動で手動で行った独自の辞書を使用してコマンドを適用し、「arpa」言語モデル タイプを「dmp」言語に変換しましたコマンドを使用してモデル化するsphinx_lm_convert -i ar.lm -o ar.lm.dmp
ため、これまでに持っているファイルは次のとおりです。
- .txt (コマンド テキスト ファイル)
- .wfreq (freq of words ファイル)
- .idngram (ngram ファイル)
- .dic (辞書ファイル)
- .phone (音素ファイル)
- .lm (arpa 言語モデル ファイル)
- .lm.dmp (DARPA Trigram ダンプ言語モデル ファイル)
次に、各単語の発言を記録しました。各単語には独自の .wav ファイルがあり、それらはすべて、.dic、.txt、.lm が存在するフォルダーとは別の 1 つのフォルダーにあります。
私の質問は、私がここで読んでいた次のステップは何ですかhttp://cmusphinx.sourceforge.net/wiki/tutorial ?
言語モデルを構築したら、既存の音響モデルを適応させることが次のステップと書いてありますが、それは言語モデルをトレーニングすることではないでしょうか?
トレーニングの場合は、次のものを除く必要なすべてのファイルがあります。
- .転写
- .fileid
これらの 2 つのファイルの中身は何ですか?
感謝