0

言語モデリングに HTKを使用する方法について混乱しています。Voxforgeサイト のチュートリアルの例に従いました

http://www.voxforge.org/home/dev/acousticmodels/linux/create/htkjulius/tutorial

トレーニングとテストの後、約 78% の精度が得られました。私は母国語でこれを行いました。今度は、言語モデリングに HTK を使用する必要があります。

同じことを行うためのチュートリアルはありますか? 私を助けてください。

ありがとう

4

1 に答える 1

1

あなたの質問を正しく理解できれば、あなたは「文法」から「n-gram 言語モデル」へのアプローチを変更しようとしています。これら 2 つの方法は、レコグナイザーが返す応答で許可される単語の組み合わせを指定する別の方法です。Voxforge のプロセスに従えば、おそらく文法が身に付くでしょう。

言語モデルは、単語が一緒に出現する確率を定義するテキストのコーパスの分析から得られます。使用されるテキスト コーパスは、非常に専門的なものにすることができます。SRILM ( http://www.speech.sri.com/projects/srilm/ ) や MITLM ( https://github.com/mitlm/mitlm ) など、コーパスを読み取って生成する分析ツールが多数あります。モデル。

母国語の単語を使用しているため、分析するには独自のテキスト コーパスが必要になります。テスト コーパスを取得する 1 つの方法は、既存の文法から人工的にいくつかの文を生成し、それをコーパスとして使用することです。次に、新しい言語モデルが整ったら、文法の代わりにレコグナイザーをそれに向けて、最善を尽くすだけです。

于 2017-01-21T08:46:09.707 に答える