HTK Tools が手書き認識でどのように機能するかを研究しています。ICFHR–2010 TUTORIALに従って、「Spanish-Numbers」コーパスの例を実行し、結果の HMM (フォルダー hmm に保存され、 にリストされているファイルHMMsList
) をres32.mlf
受け取り、認識結果を で受け取りましたHVite
。また、マスター ラベル ファイル SamplesRef.mlf もあります。HResults
そして今、私は認識結果の統計、つまり学習ツールを見たいと思っています。
私が実行するHResults
とき
HResults -I SamplesRef.mlf HMMsList res32.mlf
そうですか
====================== HTK Results Analysis =======================
Date: Tue Mar 31 15:21:11 2015
Ref : SamplesRef.mlf
Rec : res32.mlf
------------------------ Overall Results --------------------------
SENT: %Correct=0.00 [H=0, S=2, N=2]
WORD: %Corr=77.78, Acc=77.78 [H=7, D=0, S=2, I=0, N=9]
===================================================================
しかし、-p
混同行列を作成するためにオプションを追加すると、次のエラー メッセージが表示されます。
~/icfhr$ HResults -p -I SamplesRef.mlf HMMsList res32.mlf
ERROR [+3331] Index: Label millones not in list[0 of 19]
FATAL ERROR - Terminating program HResults
このメッセージは、「millones」という名前の HMM が存在しないことを意味していることを理解しており、私のres32.mlf
サンプルでは次のようになっていることがわかりました。
"’*’/210341.rec"
mil
seiscientos
cincuenta
y
siete
millones
.
res32.mlf
テキストエディタでres33.mlf
次のようなコンテンツに変更すると:
"’*’/210341.rec"
m
i
l
s
e
i
s
c
i
... 等々。
そして、内部が次のようになっているsamples.mlf
(の代わりに) を使用します。SamplesRef.mlf
"*/210341.lab"
m
i
l
@
q
u
i
n
i
e
n
t
o
s
@
c
... 等々。
私は望ましい結果を持っています:
~/icfhr$ HResults -p -I samples.mlf HMMsList res33.mlf
====================== HTK Results Analysis =======================
Date: Tue Mar 31 15:35:42 2015
Ref : samples.mlf
Rec : res33.mlf
------------------------ Overall Results --------------------------
SENT: %Correct=0.00 [H=0, S=2, N=2]
WORD: %Corr=79.63, Acc=77.78 [H=43, D=5, S=6, I=1, N=54]
------------------------ Confusion Matrix -------------------------
a c d e i l m n o s t u v y Del [ %c / %e]
@ 0 0 0 0 0 1 1 0 0 0 0 0 0 0 5 [ 0.0/3.7]
a 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0
c 0 2 0 0 0 0 0 0 0 0 0 0 0 0 0
d 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
e 0 0 0 6 0 0 0 0 0 0 0 0 0 0 0
i 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0
l 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0
m 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0
n 0 1 0 0 0 0 0 6 0 0 0 0 0 0 0 [85.7/1.9]
o 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0
q 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 [ 0.0/1.9]
s 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0
t 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0
u 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 [50.0/1.9]
v 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
y 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 [50.0/1.9]
Ins 0 0 0 0 0 0 0 0 0 1 0 0 0 0
===================================================================
したがって、主な質問は次のとおりです。
混同行列の作成に適したmlfファイルを作成する最も簡単な方法(テキストエディタなし)は何ですか?
(私はいくつかの HTK ツールのいくつかのオプションを見逃していると思います…しかし、どのツールとどのオプションが?)
有用なアイデアは高く評価されます。