0

私は音声認識システムを作っていますが、ジュリアスはこの作品で悪くない結果を示しています。サンプルの.vocaファイルの単語は完全に認識されていますが、ファイルに独自の単語と文字起こしを配置するにはどうすればよいですか?

前回のリリースでVoxForge( http://www.voxforge.org/ )を試し、その語彙を使用して音響モデルのナイトリービルドを試しましたが、ジュリアスの開始時に次のように多くのエラーが発生しました。

Error: voca_load_htkdict: line 19: triphone "r-d+v" not found
Error: voca_load_htkdict: line 19: triphone "d-v+aa" not found
Error: voca_load_htkdict: the line content was: 2   [AARDVARK]  aa r d v aa r k
Error: voca_load_htkdict: begin missing phones
Error: voca_load_htkdict: r-d+v
Error: voca_load_htkdict: d-v+aa
Error: voca_load_htkdict: end missing phones
Error: init_voca: error in reading /usr/src/custom/julius/quickstart/grammar/sample.dict
ERROR: failed to read dictionary "/usr/src/custom/julius/quickstart/grammar/sample.dict"
ERROR: m_fusion: some error occured in reading grammars
ERROR: Error in loading model

.vocaファイルの単語転記のルールを知っている人はいますか?

4

1 に答える 1

2

エラーの理由:「voca_load_htkdict.c」がdictファイルのtriphoneをAcoustic Modelのトライフォンリストと一致させようとするため、単語辞書にAcoustic Modelでトレーニングされていない単語が含まれている場合、juliusはこれらのメッセージを選択します。このエラーが表示され、プログラムが停止します。

考えられるエラーの解決策:1。-forcedictオプションを有効にするか、jconfファイルのコメントを解除して、辞書内のエラーワードをスキップし、強制的に実行します。または..2.「見つかりませんトライフォン」をhmmlistファイル「tiedlist」内の最も近い物理トライフォンにマップします。次に例を示します。b-ey+tv-eh + t最初の列は(辞書から生成された)triphoneの名前であり、2番目の列はAMで実際に定義されているHMMの名前です。

しかし、この解決策は、「見つからないトライフォン」が少なく、多すぎない場合に実行できます。

  1. 最善の解決策は、AMに含まれていない単語をdictファイルに含めないことです。最初の2つの解決策は、ジュリアスをテストするためだけのものです。これは、制作プロジェクトまたは商用プロジェクトでは、音響モデルと言語モデルを同じコーパスでトレーニングする必要があるためです。
于 2011-02-14T08:15:06.130 に答える