あいさつ仲間、
私は必死になってhtk3.4で変更する必要のあるファイルを見つけようとしています。これにより、音素/発話のモノフォンの後方プローブのシーケンスを直接読み取り、音響モデルと言語モデルの両方を指定してデコーダーに直接転送できます。
より詳細には、ステップ9までのHTKチュートリアルに従っており、モノフォンで作業したいだけです。私の(独自の、特定の)特徴ベクトルは、各音素の3つの状態の確率を持つベクトルのシーケンスです。
(p(aa_begin)、p(aa_mid)、p(aa_end)、...、p(z_begin)、p(z_mid)、p(z_end))
発話の各フレームについて、エントリは、上記のように、すでに後方の確率です。
(特定の)ファイル(独自のバイナリ形式)からそれらを読み取るためにどのファイルを変更する必要があるか、およびそれらをデコーダーに直接転送する方法はありますか?HViteとHEResultを使用して結果を取得できるようにするのに最適ですか?
助けてくれてありがとう、G。