私は opencv を使用した光学式文字認識のプロジェクトに取り組んでいます。通常の数字に ocr を正常に実装しましたが、リアルタイムのシナリオでは、数字の間に不要なノイズが発生するという問題が発生しています。元の画像
グレースケールに変換してしきい値を適用すると、次のようになります
輪郭検出を適用すると、それらの黒いブロックも取得されます.桁間のブロックを削除するにはどうすればよいですか.OCRには問題はありません.不要なノイズを除去して画像を回転させたいだけです.ありがとう.
画像から黒いブロブを回転して削除した後、これは私が達成した進歩であり、影のために最初の数字に付着しているブロックをどのように削除できますか.
私はocrに問題があります。最初と最後の 2 桁が正しく認識されません。ocr の効率を改善するにはどうすればよいですか。リアルタイムからのサンプル数字で間違っている数字でシステムをトレーニングした後、正しい結果が得られました。
最終的な ocr イメージ :最終的な ocr イメージ