1

HTK Tools が手書き認識でどのように機能するかを研究しています。ICFHR–2010 TUTORIALに従って、「Spanish-Numbers」コーパスの例を実行し、結果の HMM (フォルダー hmm に保存され、 にリストされているファイルHMMsList) をres32.mlf受け取り、認識結果を で受け取りましたHVite。また、マスター ラベル ファイル SamplesRef.mlf もあります。HResultsそして今、私は認識結果の統計、つまり学習ツールを見たいと思っています。

私が実行するHResultsとき

 HResults -I SamplesRef.mlf HMMsList res32.mlf

そうですか

====================== HTK Results Analysis =======================
  Date: Tue Mar 31 15:21:11 2015
  Ref : SamplesRef.mlf
  Rec : res32.mlf
------------------------ Overall Results --------------------------
 SENT: %Correct=0.00 [H=0, S=2, N=2]
 WORD: %Corr=77.78, Acc=77.78 [H=7, D=0, S=2, I=0, N=9]
===================================================================

しかし、-p混同行列を作成するためにオプションを追加すると、次のエラー メッセージが表示されます。

~/icfhr$ HResults -p -I SamplesRef.mlf HMMsList res32.mlf
 ERROR [+3331]  Index: Label millones not in list[0 of 19]
FATAL ERROR - Terminating program HResults

このメッセージは、「millones」という名前の HMM が存在しないことを意味していることを理解しており、私のres32.mlfサンプルでは次のようになっていることがわかりました。

"’*’/210341.rec"
mil
seiscientos
cincuenta
y
siete
millones
.

res32.mlfテキストエディタでres33.mlf次のようなコンテンツに変更すると:

"’*’/210341.rec"
m
i
l
s
e
i
s
c
i

... 等々。

そして、内部が次のようになっているsamples.mlf(の代わりに) を使用します。SamplesRef.mlf

"*/210341.lab"
m
i
l
@
q
u
i
n
i
e
n
t
o
s
@
c

... 等々。

私は望ましい結果を持っています:

~/icfhr$ HResults -p -I samples.mlf HMMsList res33.mlf
====================== HTK Results Analysis =======================
  Date: Tue Mar 31 15:35:42 2015
  Ref : samples.mlf
  Rec : res33.mlf
------------------------ Overall Results --------------------------
SENT: %Correct=0.00 [H=0, S=2, N=2]
WORD: %Corr=79.63, Acc=77.78 [H=43, D=5, S=6, I=1, N=54]
------------------------ Confusion Matrix -------------------------
       a   c   d   e   i   l   m   n   o   s   t   u   v   y  Del [ %c / %e]
   @   0   0   0   0   0   1   1   0   0   0   0   0   0   0    5 [ 0.0/3.7]
   a   2   0   0   0   0   0   0   0   0   0   0   0   0   0    0
   c   0   2   0   0   0   0   0   0   0   0   0   0   0   0    0
   d   0   0   1   0   0   0   0   0   0   0   0   0   0   0    0
   e   0   0   0   6   0   0   0   0   0   0   0   0   0   0    0
   i   0   0   0   0   6   0   0   0   0   0   0   0   0   0    0
   l   0   0   0   0   0   3   0   0   0   0   0   0   0   0    0
   m   0   0   0   0   0   0   2   0   0   0   0   0   0   0    0
   n   0   1   0   0   0   0   0   6   0   0   0   0   0   0    0 [85.7/1.9]
   o   0   0   0   0   0   0   0   0   4   0   0   0   0   0    0
   q   0   0   0   0   0   0   0   0   0   1   0   0   0   0    0 [ 0.0/1.9]
   s   0   0   0   0   0   0   0   0   0   4   0   0   0   0    0
   t   0   0   0   0   0   0   0   0   0   0   4   0   0   0    0
   u   0   0   0   1   0   0   0   0   0   0   0   1   0   0    0 [50.0/1.9]
   v   0   0   0   0   0   0   0   0   0   0   0   0   1   0    0
   y   0   0   0   0   1   0   0   0   0   0   0   0   0   1    0 [50.0/1.9]
Ins    0   0   0   0   0   0   0   0   0   1   0   0   0   0
===================================================================

したがって、主な質問は次のとおりです。

混同行列の作成に適したmlfファイルを作成する最も簡単な方法(テキストエディタなし)は何ですか?

(私はいくつかの HTK ツールのいくつかのオプションを見逃していると思います…しかし、どのツールとどのオプションが?)

有用なアイデアは高く評価されます。

4

1 に答える 1

0

-p オプションを使用するには、HMM ではなくクラスのラベル リストを提供する必要があります (つまり、Yes、No、Never という単語を認識しようとしている場合)、"HMMsList" ファイルは次のように記述します。 :

Yes
No
Never

実際に単語を構成する HMM に関係なく。「HMMsList」ファイルは「LabelsList」である必要があります

于 2016-08-20T17:45:26.630 に答える