1

デジタル画像処理に関する最終試験のために名刺スキャナーを使用しています。tesseract がテキストを認識できるように、名刺の写真を前処理する方法を教えてください。侵食、拡張、しきい値処理など、さまざまなことを試しましたが、良い結果が得られません...助けてもらえますか?

ありがとうございました

マルコ

4

2 に答える 2

2

オープン ソースの C++ 画像処理ライブラリ OpenCV とオープン ソースの無料の光学式文字認識 (OCR) ライブラリ tesseract の組み合わせをお勧めします。あなたの問題に関するあなたの情報はあまり具体的ではないので、私はあなたの質問に一般的に答えることができます.OCRの主な手順は次のとおりです.

  1. 画像に対してある種の前処理を実行します
  2. ROI (対象領域、テキストを含む領域) を取得するためのテキスト検出
  3. 文字検出 (テキストのみの画像を取得し、tesseract の入力として使用します

tesseract について一言: オンラインで入手できるライブラリに関する情報はたくさんあります。これは、Google ブックスの OCR 目的で使用される Google オープン ソース ライブラリです。画像のレイアウト分析も処理できますが、これは完全ではありません。したがって、自分で前処理し、実際の文字認識部分にのみ tesseract を使用すると、より良い結果が得られます。まだ質問がある場合、または質問を誤解している場合は、お気軽に質問してください。

于 2015-04-11T09:28:39.583 に答える
2

前処理ではなくテキスト認識のみに関心がある場合は、ScanTailorの使用を検討してください。これは優れた前処理ツールであり、オープン ソースです。

前処理を自分で実装したい場合は、このペーパー、特にスキュー補正とバックグラウンド推定をご覧になることをお勧めします。ここで説明するアルゴリズムの結果は良好です。ScanTailor はこれらのいくつかを使用します。

于 2012-08-09T10:03:14.220 に答える