問題
私は (非常に) シンプルな OCR エンジンを構築してきました。非常に小さい (ピクセル サイズ) 文字を分類しようとしているので、セグメンテーションに問題があります。以下は、ベスト エフォート型の画像全体のしきい値処理後の例です。
:
私が試したこと
エラー検出:
- セグメントの大きな水平サイズ。ほとんどの場合は機能しますが、いくつかの大きな文字では失敗します (誤検知)。
- 分類し、低いスコアで拒否します。これは少し無駄に思えます。
エラー訂正:
- 垂直方向にピクセルを追加し (垂直ヒストグラム)、最小値を見つけます。多くのサンプルで、間違った場所で多くのセグメントをカットします。
まだ試していないこと
- 考えられるすべてのセグメンテーション ポイント (ピクセル) で分類しようとしています。これは非常に無駄が多く、3 文字のマージ セグメントを拡張するのは困難です。
- 文字を数学的曲線に変換するための形態学的アプローチについて調べてきましたが、どこから始めればよいか、または努力する価値があるかどうかはわかりません
ここからどこへ行く?
何も思いつきません。したがって、この質問:)