1

OCR プロジェクトに取り組んでいますが、スキャンしたドキュメント イメージを tesserract に渡す前にグラフィックスを削除する方法がわかりません。グラフィックを削除したいスキャンしたドキュメントは次のとおりです。

http://www.mediafire.com/view/hvmpty2z3cw3vao/IMG_0087.JPG

http://www.mediafire.com/view/1sgy5s2aaj2o8y3/IMG_0086.JPG

どんなアドバイスでも大歓迎です。どうもありがとう。

4

2 に答える 2

1

テキスト領域は通常まばらで互いに接続されていないため、元の画像でソーベル エッジ検出を行い、画像領域を検出するためのしきい値で最大の接続領域を検出することを検討できます。

一方、画像は長方形の領域なので、直線を検出するハフ変換を行い、4 本の線で構成される長方形を作成する方法もあります。この方法を使用する場合は、計算の複雑さを軽減するために、最初に画像をズームすることをお勧めします。

于 2013-10-23T07:39:41.460 に答える