こんにちは私は機械学習を勉強しています。Pythonとopencvを使用して簡単な手書き認識ソフトウェアを作成したいと思います。
簡単にするために、同じサイズの大文字の単語のみを認識します。文字を認識する良い方法は、ガウス混合モデルのパラメーターを学習するために期待値最大化アルゴリズムを使用し、トレーニングセットを使用して、新しい文字のガウス混合をトレーニング済みのものと比較することだと思います。しかし、混合物に含まれるガウス関数の数を選択する方法がわかりません。
2番目の問題は、ページに含まれる単語の数と、単語に含まれる文字の数をどのように理解するかです。em-algorithmまたは同様のもの(たとえばk-means)が解決策になるとは思いませんが、確かにいくつかのセグメンテーションの問題があります
いくつかのアドバイス?