Visual Studioプラットフォームで手書き認識と関連するものに取り組んでおり、openCVライブラリを使用しています。入力は、バイナリスキャンされた.tif画像の形式です。
現在、私は、直線/曲線を使用して単語を三振(キャンセル)するのと同じように、三振された単語を認識する方法を見つけようとして障害に直面しました。計算能力の無駄になるような個別の文字認識を行うつもりはありません。
別の方法でそのような出来事を認識する方法はありますか?
以下は私が思いついた2つのアイデアですが、よくわかりません-1>すべての水平線を見つけるのに役立つ<0 0 0、1 1 1、000>のようなマスクを使用します...しかしこれは非常に大きな仮定。線は波状で任意の方向にすることができます。
2>入力をスケルトン化し、交差を探します。これにより、かなりの数の交差点が得られます。これには、単語を打ち消すために使用される線が原因で発生する交差点も含まれます。最小二乗法などの近似を使用します。近似線を取得できます。しかし、交差点が多くの場所で発生する可能性があるという問題があります。'b'などの2つの交差点。
助言がありますか?