孤立した文字の多くの画像から特徴を抽出しました (勾配、隣接するピクセルの重み、幾何学的特性など)。このデータでトレーニングされた分類器として HMM を使用するにはどうすればよいですか? HMM について読んだすべての文献は状態と状態遷移に言及していますが、 「それを機能やクラスのラベル付けに接続しないでください。JAHMM のホームページの例は、私の問題とは関係ありません。HMM を使用する必要があるのは、この問題に対する他のアプローチよりもうまく機能するからではなく、プロジェクトのトピックに関する制約のためです。
この質問に対するオンライン認識の回答がありましたが、オフラインでも同じことをもう少し詳しく知りたいです
編集:各文字を一定数の正方形のグリッドに分割しました。現在、各グリッド ブロックで特徴抽出を実行し、左から右、上から下に移動して、各サンプルの一連の特徴を取得することを計画しています。
これは、HMM にとって適切な「シーケンス」を表すでしょうか。つまり、文字が左から右、上から下に描かれていない場合でも、HMM はデータの時間的変化を推測できますか? そうでない場合は、別の方法を提案してください。
多くの機能をフィードする必要がありますか、それとも少数から開始する必要がありますか? HMM が十分に機能していないか、機能が悪いかどうかを知るにはどうすればよいですか? JAHMMを使用しています。
ストロークの特徴を抽出するのは難しく、グリッドの特徴と論理的に組み合わせることができませんか? (HMM は何らかのランダムなプロセスによって生成されたシーケンスを想定しているため)