私たちは大学で同様の演習に取り組みました。
ストロークの順序は漢字で明確に定義されており、ストロークは8つ(?)しかないためです。基本的に、各漢字は整然としたストロークのシーケンスです。te(手)のように、「短い下向きの後方ストローク」、次に「左から右へのストローク」の2倍、最後に「下部に小さな先端がある長い下向きのストローク」のシーケンスがあります。この情報を提供するデータベースがあります。
これで、正しいストロークを特定するための問題がほぼ軽減されました。いくつかのストロークが他のストロークとどの空間関係にあるかを考慮しなければならないいくつかのあいまいさにまだ遭遇します。
編集:ストローク認識のために、フリーハンドの書き込みを45度(キーボードの小さな円の記号はどこですか?)の角度にスナップし、これらの方向の1つに沿った一連のベクトルに変換しました。方向ゼロが下から上、方向1が右下から左上、2が右から左というようにCCWであると仮定します。
次に、te(手)の最初のストロークは[23] +になります(一部の人はそれを落下させて水平に書くように)2番目と3番目のストロークは6+になり、最後のストロークは4+ [123]になります(小さな先端のように) 、すべての作家は異なる方向を使用します)
この粗いスナップは、実際には漢字を認識するのに十分でした。もっと洗練された方法があるかもしれませんが、この単純な解決策は漢字の約90%を認識することができました。一人の教授の筆跡しか把握できなかったが、問題は自分以外の人間も筆跡を読めないことだった。
EDIT2:書道では多くのストロークが1つにマージされるため、ユーザーが漢字を「印刷」し、書道で書かないことが重要です。書道で「田んぼ」の部首を使って漢字を書くときのように、この部首はまったく違うものに変身します。または、水平ダッシュが多い部首(「スピーチ」iuの部首など)は、1本の長いしわくちゃの線になります。