1

HMM ベースの認識エンジンを作成するために使用する統計パラメータを計算しているオンラインの手書きサンプルの xy 座標があります。

HMM ツールキットや HTK はもともと音声認識用に作成されているため、HTK を使用してオンラインの単語認識を実行する方法を理解できません。

私のパラメーターをこのツールキットへの入力として与える方法と、それが与える出力を理解するのを手伝ってくれませんか?????

4

1 に答える 1

0

おっしゃる通り、HTKは音声認識のために開発されました。HTK ツールキットは、すべてが連携して動作する特別な目的のプログラムの集まりです。

これは、期待される入力と出力を含め、各プログラムが設計された目的を説明するマニュアルのバージョンです。

ただし、手書き認識に HTK を使用しようとすると、困難な戦いになることを警告しておきます。それは単にそれを念頭に置いて書かれたものではありません。リンクされたマニュアルの冒頭の段落には、次のように書かれています。

HMM は任意の時系列をモデル化するために使用でき、HTK のコアは同様に汎用的です。ただし、HTK は主に HMM ベースの音声処理ツール、特に認識器を構築するために設計されています。したがって、HTK のインフラストラクチャ サポートの多くは、このタスク専用です。

于 2013-12-17T21:09:01.343 に答える